京都大学、東京大学などの教育機関、日本マイクロソフトなどの事業者、合わせて14の組織で構成された共同事業体は、一般社団法人AIデータ活用コンソーシアムを設立し、2019年4月より活動を開始する。その目的は、国内におけるAI(人工知能)モデルを開発する上でのデータ流通の促進だ。

AIデータ活用コンソーシアム会長の長尾真氏(元京都大学総長/元独立行政法人情報通信研究機構理事長/前国立国会図書館長/前国際高等研究所所長)
AIデータ活用コンソーシアム会長の長尾真氏(元京都大学総長/元独立行政法人情報通信研究機構理事長/前国立国会図書館長/前国際高等研究所所長)
[画像のクリックで拡大表示]

 日本のAIの研究開発におけるデータの利用は、海外に比べて大幅に遅れているという危機感が同コンソーシアムの設立の背景にある。中国では国が主導してデータを集めており、米国ではグローバル企業が膨大なデータを集めて利活用を進めているが、日本では標準的なデータセットさえも整備されていないという。

 日本固有の画像データや言語情報を整備していく必要がある。また、AIにデータを学習させる際に、マルチモーダルデータ(複数の異なる情報源から集めたデータ)を利用することが今の研究の大きな流れだという。例えば、「やばい」という言葉単体を学習しただけでは、それがポジティブな意味なのかネガティブな意味なのか分からない。動きのデータや画像データなどを合わせて学習させることで初めて判断できるようになる。そのためにも、多様なデータの整備を進める必要があるという。

副会長の杉山将氏(理化学研究所 革新知能統合研究センター センター長、東京大学 大学院新領域創成科学研究科 教授)
副会長の杉山将氏(理化学研究所 革新知能統合研究センター センター長、東京大学 大学院新領域創成科学研究科 教授)

このコンテンツ・機能は有料会員限定です。