一休社長の榊淳氏が気鋭のデータサイエンティストを訪ね、「データサイエンスの未来」を語り合う対談企画。今回は2018年に起きた自然言語処理のブレークスルーとそのインパクトについて、AI(人工知能)スタートアップ、ストックマーク(東京・港)の林達社長と語り合う。

AI(人工知能)スタートアップ、ストックマークの林達社長(右)と一休の榊淳社長(左)
AI(人工知能)スタートアップ、ストックマークの林達社長(右)と一休の榊淳社長(左)

榊淳氏(以下、榊氏) 前回の対談で、2016年に会社を設立するまでの経緯は分かりました。ストックマークにとって自然言語処理(NLP)は重要な技術ですが、ディープラーニングが世の中に出てきたのが10年。いつからNLPに目を付けていたのですか。

林達氏(以下、林氏) NLPが実用的になったのは18年ころだと思いますが、BERTやELMoといった、さまざまな汎用言語モデルが公開されたことが、実用化に向けたブレークスルーになったと思います。

榊氏 汎用言語モデルを知らない人向けに、なぜビジネスに適用できるようになったのか。解説してもらえますか。

林氏 汎用言語モデルが登場する以前のNLPで可能なのは、文章を分かち書きにして、単語を抽出することが中心でした。ビジネスで使うには、それでは不十分。全ての単語をベクトルに置き換えて、単語の意味まで理解する必要があるからです。

 BERTやELMoは、いわば「日本語の義務教育を終えている状態」の言語モデルです。そこに専門分野に特化した教師データを渡すと、情報の判別や意味の理解までが可能になります。

榊氏 文章を単語に分解して、数学的に理解するアプローチは以前からありました。そこにBERTやELMoが登場して、画像解析と同じように自然言語処理の精度が一気に向上した。ではNLPは、ストックマークのビジネスにどれほどインパクトを与えたのですか。

林氏 あらかじめ設定したゴールを目指してプロダクトを開発できるようになりました。処理精度が向上するので、設定したゴールと現在地とのギャップが、いつになれば埋められるのかという、時間の問題として考えられるようになった。

 それまでは、結果を得るためのモデル構築に数万件の教師データが必要でした。しかし汎用言語モデルを使えば、教師データを数百件程度、用意すればよくなったのです。

対談ゲスト:ストックマーク社長 林 達氏
東京大学文学部宗教学科卒業。台湾出身で貿易業を営む両親の下に生まれ、幼少期を台湾、日本の往復で過ごす。学生時代には、東京大学・北京大学・ソウル大学の学生交流ネットワークで、300人規模のフォーラムを主催。その後、東アジアの富裕層向けインバウンドサービスを提供するスタートアップを設立、大手旅行代理店との提携、行政との共同事業を成功させる。大学卒業後、伊藤忠商事で投資戦略策定及び事業投資、事業会社管理業務に従事。16年ストックマークを創業。AIとテキストマイニングを強みとするSaaSである「Anews」、「Astrategy」、「Asales」を開発・運営。AIによって日本企業のビジネス・プロセスを再定義し、グローバルでの競争力を高めるべく奔走中

榊氏 そんなブレークスルーが可能になったと知って、どんな気持ちになりましたか。「キター!」という感じですか。

林氏 まさにそうです。AIの世界では、米グーグルのようなグローバルプレーヤーが新しいアルゴリズムを開発するとエンジニアたちが盛り上がり、1年くらい遅れてビジネスで使えるようになります。

有料会員になると全記事をお読みいただけるのはもちろん
  • ①2000以上の先進事例を探せるデータベース
  • ②未来の出来事を把握し消費を予測「未来消費カレンダー」
  • ③日経トレンディ、日経デザイン最新号もデジタルで読める
  • ④スキルアップに役立つ最新動画セミナー
ほか、使えるサービスが盛りだくさんです。<有料会員の詳細はこちら>