Preferred Networksの海野裕也氏による寄稿の後編。「言葉で指示できるロボット」の研究で早期に予想以上の精度を出すことに貢献したのは、クラウドソーシングを通じたデータ収集だった。AI(人工知能)はまだ1歳児のレベルだという海野氏だが、今すぐビジネス活用をすべきと勧める理由とは……。

 海野氏は日経クロストレンドの創刊記念イベント「日経 xTREND FORUM 2018」内で、「予測型戦略を知るための機械学習講座」と題して6月19日(火)午後2~5時に講演をする。機械学習の種類を体系的に紹介していき、機械学習を用いたビジネスアプローチ方法にはどういったものがあるのかを講義する。

 「言葉で指示できるロボット」の研究をしていることを前編「話し言葉で動くロボットを研究 多品種少量生産のニーズへ対応も」で紹介した。こうした日常生活で活躍するロボットを実現するためには、「学習データ」の作成が重要になる。深層学習をはじめとする機械学習とは、規則を明示的に書く代わりにデータを利用する。例えば猫の写真と犬の写真のデータを大量に用意して学習させることで、猫と犬を見分けられるようになる。インターネットで大量のデータを収集できるようになったことが、深層学習の性能向上の背景の1つにある。

学習データに関わる大問題

 しかし、今回は大きな問題があった。既存の学習データが役に立ちそうになかったのだ。これまでの言葉の研究は、新聞記事、Webサイトのテキストなどの書き言葉が中心だ。日常の話し言葉を理解するためには、学習データとして話し言葉が必要になる。加えて、ロボットに指示を出しているような画像のデータが一緒に必要である。このようなデータがインターネット上に転がっているわけがない。研究の初期の段階から、いかに効率よく学習データを作成するかを考え、今回はクラウドソーシングのサービスを利用することにした。

 データの作成に当たっては、まずホームセンターで買い集めた物を4つに仕切った箱の中に配置した画像を用意。クラウドソーシングのワーカーの方に、それぞれの物を移動させるなら何と指示を出すかを書いてもらった。例えば「右下にある輪ゴムを左上に動かして」といった具合だ。