ディープラーニング(深層学習)研究では国内トップレベルの東京大学・松尾研究室のメンバーが開催する最新論文の輪読会から、話題の論文を紹介する本連載の第5回。今回は、多くの学習データを用いないと十分な性能が発揮できない深層学習において、少ない学習データでも十分な性能が発揮できる手法を紹介する。

図1 ドメインの違いの例。上段はカメラの画質とフラッシュの有無による違い、下段はおもちゃのサンプル写真と実際に子供がそれを使っている様子による違いを表している(出所:https://people.eecs.berkeley.edu/~jhoffman/domainadapt/)
図1 ドメインの違いの例。上段はカメラの画質とフラッシュの有無による違い、下段はおもちゃのサンプル写真と実際に子供がそれを使っている様子による違いを表している(出所:https://people.eecs.berkeley.edu/~jhoffman/domainadapt/)

 深層学習は近年、画像認識、音声認識など特定のタスクで人間の性能を上回り、注目を集めている。しかし、深層学習が十分な性能を発揮できるのは大量のラベル付きデータが存在する場合に限られている。深層学習を現実のさまざまな問題に適用していくときに、その都度大量のデータを集めたり、ラベル付け(アノテーション)をしたりするのはコストの観点から好ましくない。また、人間が新しく遭遇したヒトやモノの名前を素早く覚えるのと比較すれば、大量のデータを必要とする深層学習が人間の知能の在り方とかけ離れていることに気づく。そこで、少ないデータから深層学習モデルが学習できるようになれば、深層学習の社会実装および人間が持つ知能それぞれに対する理解の助けになると考えられる([Bengio 2018]*1)。

*1 Yoshua Bengio, Towards disentangling underlying explanatory factors, Talk at the ICML'2018 Workshop on Learning with Limited Labels, July 13th, 2018
有料会員になると全記事をお読みいただけるのはもちろん
  • ①2000以上の先進事例を探せるデータベース
  • ②未来の出来事を把握し消費を予測「未来消費カレンダー」
  • ③日経トレンディ、日経デザイン最新号もデジタルで読める
  • ④スキルアップに役立つ最新動画セミナー
ほか、使えるサービスが盛りだくさんです。<有料会員の詳細はこちら>