ディープラーニングは「眼の誕生」

 ディープラーニングの成果は、特に画像認識の分野でめざましい。例えば、ある写真を「ゴッホ風」「ピカソ風」に変換できるプログラムや、シマウマを馬に変換したり、夏の写真を冬の写真に変換するプログラム、動物の写真の眼の部分だけを増殖させるプログラムなどが最近、注目を集めた。

 「ディープラーニングは一言で言うと『眼の誕生』だ」と松尾氏。『眼の誕生――カンブリア紀大進化の謎を解く』(アンドリュー・パーカー著)では、地球上の生物が爆発的に増えた理由を「高度な眼を持った生物が誕生したから」と解説する。「高度な眼を持った三葉虫は、獲物を探す時などに圧倒的に有利で大繁殖した。すると、捕食される方も眼を持ち始め、早く逃げよう、隠れよう、擬態しようなど生存戦略が多様化し、種が多様化した」(松尾氏)

 ディープラーニングによって「眼」を手に入れたコンピューターやロボットにも「同じことが起きる」と松尾氏。「機械やロボットがこなせるタスクの量や質が圧倒的に増えるだろう」。

東京大学大学院工学系研究科特任准教授の松尾豊氏
東京大学大学院工学系研究科特任准教授の松尾豊氏

人間の知能と、AI進化の方向は

 ディープラーニングは、画像処理だけでなく機械翻訳にも活用されるなど、言語も高精度に扱えるようになってきた。松尾氏は、「人間の知能は2階建てになっている」と説明し、言語とディープラーニングとの関係についてこう解説する。

 「人間の知能の『1階部分』はほかの動物とほとんど一緒で、エサがあれば食べる、ものがあればつかむなど、環境を捉えて適応的に行動する知覚運動系だ。これがディープラーニングによって完成しつつある」

 「2階部分」は「記号や言葉」だ。例えば、動物が「山の向こうに水を飲みに行こう」と思うとき、「山を上り、その後下って川に行く」といったプランを立てる「記号的処理」を行う。人間の場合は、記号に基づいて短期的なプランを立てるだけでなく、「言葉から想像することができる」のが特徴。「2階が1階を駆動できる」と松尾氏は説明する。「人間は情景を思い浮かべられる。例えば、リンゴがない場所にリンゴを思い浮かべられ、『リンゴを奪った敵に対して、結束して戦おう』と信じて結束できる」。

 ディープラーニングによって1階部分が完成しつつある今、今後の技術は2階部分を完成させる方向に進んでいくと松尾氏。ただ、言葉の理解や機械翻訳、社会現象のモデル化といった研究も、米国をはじめとした海外が圧倒的に先行しているという。