「日経クロストレンド」創刊記念イベント「日経クロストレンド FORUM 2018」が2018年6月18日に開幕した。基調講演では「ディープラーニングの先にあるもの――ビジネス課題を解決できるのか、その疑問に答える」と題し、人工知能(AI)研究の第一人者として知られる東京大学大学院工学系研究科特任准教授の松尾豊氏が登壇。ディープラーニングの現状と、ビジネスへの応用や、日本企業の可能性について語った。なお、日経クロストレンドFORUMは、6月19日がイノベーション、20日がブランディングをテーマに開催する。

「日経クロストレンド FORUM 2018」は6月18~20日に、赤坂インターシティコンファレンスで開催
「日経クロストレンド FORUM 2018」は6月18~20日に、赤坂インターシティコンファレンスで開催

3歳児にできることがようやく…

 「3歳児にできることが、ようやくコンピューターにできるようになった。それによって世の中や産業社会がどうかわるのか考えればいい」――ディープラーニングとビジネスの関係について、松尾氏はこう解説する。

 医療診断や数学の定理の証明など難しそうなことは、実はコンピューターにとって簡単で、むしろ「積み木を積む」「猫を見て猫と判断する」など、幼児でもできることが難しいとされてきた。これは「モラベックのパラドックス」と呼ばれる。

 ディープラーニングでそれが変わりつつある。猫の画像を高精度に識別したり、さまざまな形のパーツを認識し、ロボットアームで上手に握って分類するといったことが、ディープラーニングにより可能になってきたのだ。

ディープラーニングは「眼の誕生」

 ディープラーニングの成果は、特に画像認識の分野でめざましい。例えば、ある写真を「ゴッホ風」「ピカソ風」に変換できるプログラムや、シマウマを馬に変換したり、夏の写真を冬の写真に変換するプログラム、動物の写真の眼の部分だけを増殖させるプログラムなどが最近、注目を集めた。

 「ディープラーニングは一言で言うと『眼の誕生』だ」と松尾氏。『眼の誕生――カンブリア紀大進化の謎を解く』(アンドリュー・パーカー著)では、地球上の生物が爆発的に増えた理由を「高度な眼を持った生物が誕生したから」と解説する。「高度な眼を持った三葉虫は、獲物を探す時などに圧倒的に有利で大繁殖した。すると、捕食される方も眼を持ち始め、早く逃げよう、隠れよう、擬態しようなど生存戦略が多様化し、種が多様化した」(松尾氏)

 ディープラーニングによって「眼」を手に入れたコンピューターやロボットにも「同じことが起きる」と松尾氏。「機械やロボットがこなせるタスクの量や質が圧倒的に増えるだろう」。

東京大学大学院工学系研究科特任准教授の松尾豊氏
東京大学大学院工学系研究科特任准教授の松尾豊氏

人間の知能と、AI進化の方向は

 ディープラーニングは、画像処理だけでなく機械翻訳にも活用されるなど、言語も高精度に扱えるようになってきた。松尾氏は、「人間の知能は2階建てになっている」と説明し、言語とディープラーニングとの関係についてこう解説する。

 「人間の知能の『1階部分』はほかの動物とほとんど一緒で、エサがあれば食べる、ものがあればつかむなど、環境を捉えて適応的に行動する知覚運動系だ。これがディープラーニングによって完成しつつある」

 「2階部分」は「記号や言葉」だ。例えば、動物が「山の向こうに水を飲みに行こう」と思うとき、「山を上り、その後下って川に行く」といったプランを立てる「記号的処理」を行う。人間の場合は、記号に基づいて短期的なプランを立てるだけでなく、「言葉から想像することができる」のが特徴。「2階が1階を駆動できる」と松尾氏は説明する。「人間は情景を思い浮かべられる。例えば、リンゴがない場所にリンゴを思い浮かべられ、『リンゴを奪った敵に対して、結束して戦おう』と信じて結束できる」。

 ディープラーニングによって1階部分が完成しつつある今、今後の技術は2階部分を完成させる方向に進んでいくと松尾氏。ただ、言葉の理解や機械翻訳、社会現象のモデル化といった研究も、米国をはじめとした海外が圧倒的に先行しているという。

日本企業の勝ち目は?

 では、日本企業はどこで戦えばよいのか。「ディープラーニングとものづくり、ハードウエアの技術を組み合わせることが日本にとって大きなチャンス。労働集約的な産業に大きな変化がある」と松尾氏は話す。

 例えば、「収穫したトマトの品質をチェックする」「顧客の表情を見る」など、これまで熟練した職人やスタッフの経験が必要だった分野にディープラーニングを導入して機械化・省力化したり、収穫作業や調理、盛り付けといった作業の自動化に可能性があると展望。「産業ごとに非常に強いプレーヤー、支配者が出てくるだろう」と話す。

 ただ、この分野でも中国の成長はめざましく、米国も先行している。「日本はこのままだと米中に負けてしまう。新しい技術、人への投資をきちんとやらないといけない」

ディープラーニングでヒット曲を作れるか?

 講演の最後には、日経クロストレンドコメンテーターで、宇多田ヒカルさんの宣伝などを担当するソニー・ミュージックレーベルズ EPICレコードジャパン RIAオフィス部長の梶望氏が、音楽や創作のフィールドから、AIにまつわる素朴な疑問を松尾氏にぶつけた。

ソニー・ミュージックレーベルズ EPICレコードジャパン RIAオフィス部長の梶望氏
ソニー・ミュージックレーベルズ EPICレコードジャパン RIAオフィス部長の梶望氏

Spotifyなどサブスクリプション型音楽サービスでは、「眠るときに聴く音楽」「パーティで食欲を促進する音楽」などのプレイリストがよく再生され、隠れたヒットが生まれている。こうした「生理的欲求を支援できる音楽」は、近い将来AIで作れるのではないか?

AIは模倣ができ、「似た曲」を作ることができる。眠くなる音楽やヒット曲の例をたくさん集めると、それに似たものは作れるようになる。また、ユーザーの挙動を何らかの方法で観察できるようになれば、その挙動を目的に近づけるような曲を、いろいろなバリエーションから見つけ出すことができ、より創造に近いことが可能になるだろう。

若者に大ヒットしたある曲についてディレクターに聞いたら、「僕が夜な夜な『mixi』をチェックし、若者の言葉をつなげて歌詞を作った」と話していた。こうした作業は、AIで代替できるのではないか。

結構できると思う。歌詞は、意味が通っているかどうかより、言葉の響きやつながりが重視されると思うので、AIに向いている。ただ、高いレベルで、聴く人に情景を思い浮かべさせる詞を書くのはAIには難しいだろう。

短歌や俳句を詠むことはAIに可能か。

知能は、「2階部分」の言葉が「1階」のイメージを駆動するものだが、短歌や俳句はこれをハイコンテクストでやっている。文脈がかなり共有されていなくてはならないし、非常に細やかな感性や経験、思いが必要な世界なので難しい。もしそこまでできたら、AIによる意味理解は完成に近いだろう。

ソニーグループは、仏パリの研究機関と一緒に、アーティストの想像力を補完するような、AIの作曲支援システムを作ろうとしている。こうしたことは近い将来、可能になると考えていいか。

数が多かったりクオリティが不要だったりなど、(単価が)安いことならば可能になる。人の介在が必要なのは、より高付加価値な分野だ。例えば、AIによる医療診断は、発展途上国でも進むだろう。人間のお医者さんにかかるのは、より高付加価値になるだろう。

アーティストは普通の人とは違う感覚を持っている。平均と違う感覚をAI化していくのは難しいか?

どちらかというと、AIに普通の人の感覚を入れるほうが難しい。知能と生命で考えると、知能はある種の原理があり、簡単にできるはずだと思っているが、生命は、長い期間をかけた進化による作り込みでできているため、まねるのがすごく難しい。

知性はどうか。

知性が「人間社会に根ざした知的な行動」を意味しているなら、「人間社会に根ざした」という部分を作るのがすごく難しいかもしれない。

例えば「とんち」のようなものはどうか。「一休さん」で「屏風の虎」というとんちエピソードがある。屏風の虎を捕らえるのは、「知能」が高いと無理だが、「知性」が高い人はできると言える。

今のAIは、屏風の虎と普通の虎を見分けることはできるが、「これが屏風だ」とか「本物の虎だ」など、現実世界を認識する能力が決定的に欠けており、世界の捉え方がすごく一面的で偏っている。「普通じゃない見え方」をしているとも言え、ある面からするとクリエイティブとは言えるかもしれない。

(写真/新関 雅士、稲垣 純也)