一休社長の榊淳氏が気鋭のデータサイエンティストを訪ね、「データサイエンスの未来」を語り合う対談企画。今回は2018年に起きた自然言語処理のブレークスルーとそのインパクトについて、AI(人工知能)スタートアップ、ストックマーク(東京・港)の林達社長と語り合う。
榊淳氏(以下、榊氏) 前回の対談で、2016年に会社を設立するまでの経緯は分かりました。ストックマークにとって自然言語処理(NLP)は重要な技術ですが、ディープラーニングが世の中に出てきたのが10年。いつからNLPに目を付けていたのですか。
林達氏(以下、林氏) NLPが実用的になったのは18年ころだと思いますが、BERTやELMoといった、さまざまな汎用言語モデルが公開されたことが、実用化に向けたブレークスルーになったと思います。
榊氏 汎用言語モデルを知らない人向けに、なぜビジネスに適用できるようになったのか。解説してもらえますか。
林氏 汎用言語モデルが登場する以前のNLPで可能なのは、文章を分かち書きにして、単語を抽出することが中心でした。ビジネスで使うには、それでは不十分。全ての単語をベクトルに置き換えて、単語の意味まで理解する必要があるからです。
BERTやELMoは、いわば「日本語の義務教育を終えている状態」の言語モデルです。そこに専門分野に特化した教師データを渡すと、情報の判別や意味の理解までが可能になります。
榊氏 文章を単語に分解して、数学的に理解するアプローチは以前からありました。そこにBERTやELMoが登場して、画像解析と同じように自然言語処理の精度が一気に向上した。ではNLPは、ストックマークのビジネスにどれほどインパクトを与えたのですか。
林氏 あらかじめ設定したゴールを目指してプロダクトを開発できるようになりました。処理精度が向上するので、設定したゴールと現在地とのギャップが、いつになれば埋められるのかという、時間の問題として考えられるようになった。
それまでは、結果を得るためのモデル構築に数万件の教師データが必要でした。しかし汎用言語モデルを使えば、教師データを数百件程度、用意すればよくなったのです。
榊氏 そんなブレークスルーが可能になったと知って、どんな気持ちになりましたか。「キター!」という感じですか。
林氏 まさにそうです。AIの世界では、米グーグルのようなグローバルプレーヤーが新しいアルゴリズムを開発するとエンジニアたちが盛り上がり、1年くらい遅れてビジネスで使えるようになります。
このコンテンツ・機能は有料会員限定です。
- ①2000以上の先進事例を探せるデータベース
- ②未来の出来事を把握し消費を予測「未来消費カレンダー」
- ③日経トレンディ、日経デザイン最新号もデジタルで読める
- ④スキルアップに役立つ最新動画セミナー