Preferred Networksの海野裕也氏による寄稿の後編。「言葉で指示できるロボット」の研究で早期に予想以上の精度を出すことに貢献したのは、クラウドソーシングを通じたデータ収集だった。AI(人工知能)はまだ1歳児のレベルだという海野氏だが、今すぐビジネス活用をすべきと勧める理由とは……。
「言葉で指示できるロボット」の研究をしていることを前編「話し言葉で動くロボットを研究 多品種少量生産のニーズへ対応も」で紹介した。こうした日常生活で活躍するロボットを実現するためには、「学習データ」の作成が重要になる。深層学習をはじめとする機械学習とは、規則を明示的に書く代わりにデータを利用する。例えば猫の写真と犬の写真のデータを大量に用意して学習させることで、猫と犬を見分けられるようになる。インターネットで大量のデータを収集できるようになったことが、深層学習の性能向上の背景の1つにある。
学習データに関わる大問題
しかし、今回は大きな問題があった。既存の学習データが役に立ちそうになかったのだ。これまでの言葉の研究は、新聞記事、Webサイトのテキストなどの書き言葉が中心だ。日常の話し言葉を理解するためには、学習データとして話し言葉が必要になる。加えて、ロボットに指示を出しているような画像のデータが一緒に必要である。このようなデータがインターネット上に転がっているわけがない。研究の初期の段階から、いかに効率よく学習データを作成するかを考え、今回はクラウドソーシングのサービスを利用することにした。
データの作成に当たっては、まずホームセンターで買い集めた物を4つに仕切った箱の中に配置した画像を用意。クラウドソーシングのワーカーの方に、それぞれの物を移動させるなら何と指示を出すかを書いてもらった。例えば「右下にある輪ゴムを左上に動かして」といった具合だ。
このコンテンツ・機能は有料会員限定です。
- ①2000以上の先進事例を探せるデータベース
- ②未来の出来事を把握し消費を予測「未来消費カレンダー」
- ③日経トレンディ、日経デザイン最新号もデジタルで読める
- ④スキルアップに役立つ最新動画セミナー