多様なビッグデータというヤフーの強みを生かした研究を進めるYahoo! JAPAN研究所が、成果を拡大させている。2016年の論文数は前年の2倍以上となり、今年3月にはユビキタス領域のトップカンファレンスに投稿した論文がトップ3に選出された。社内外の連携が効果を発揮し、研究の量と質の両面を向上させている。

 「3月にユビキタスのトップカンファレンスでトップ3に入った。これは画期的(な成果)だ」

 Yahoo! JAPAN研究所の田島玲所長は、興奮気味にこう話す。

68万人を対象に実験

 論文のテーマはスマートフォンのプッシュ通知が開封されやすいタイミングを予測すること。端末のセンサーデータから分かる身体動作、具体的には自動車や自転車、徒歩での移動状況、静止状況、端末を傾けるなどのデータを機械学習で解析した。

スマへのプッシュ通知を個別に最適化する実験では、開封までの時間が平均49.7%短縮した
スマへのプッシュ通知を個別に最適化する実験では、開封までの時間が平均49.7%短縮した

 2016年9月に「Yahoo! JAPAN」アプリからランダムに選んだ約68万人のユーザーを対象に実施した実験では、ユーザーの状況から最適であろうタイミングを個別に判断してプッシュ通知した。その結果、開封までの時間が平均49.7%短縮され、開封数を最大約5.5%向上させることができたという。

 この実験について、慶應義塾大学大学院政策・メディア研究科大越匡特任講師らのグループと共同で研究論文を執筆。ユビキタス領域でトップカンファレンスとされる「IEEE PerCom」に投稿したところ、全194本中トップ3に選ばれたのだ。数十人の学生を対象にしたような実験ではなく、実際のサービスを利用する68万人を対象にした実験だったところが大きなインパクトを持ったという。

ネコと猫は検索意図が違う

 論文という成果だけでなく、検索サービスなどでの音声認識の精度向上、ニュース記事の自動分類など、Yahoo! JAPANのサービス向上につながる成果も出ている。

 中でも大きな成果を出したのが、「質拡張学習」と呼ぶ手法の開発だ。インターネット広告の世界では「オーディエンス拡張」といわれている手法のヤフー版となる。

 オーディエンス拡張とは、例えばある化粧品を購入した人が、それまでにどんな情報を見ていたかを基にモデルを作り、同様のページを見る人にその化粧品の広告を見せることで購買確率を上げるものだ。

 ヤフーの質拡張学習では検索履歴も判断材料に加える。

 それも一工夫されている。「同じ猫でもどう表記するかによって人の興味関心は違う」と田島所長は指摘する。例えば、「ネコ」はペットとしてのネコ、「猫」ならキャラクターとしての猫に関心を持っている可能性が高いといった具合だ。その言葉の表記まで含めてユーザーの興味関心を特定する。

 キャンペーンに適用して「(提案した情報の)クリック率、コンバージョン率が4~5倍になった事例もある」(田島所長)という成果が出ている。また、Yahoo!検索は使っているけどYahoo!ショッピングは初めて使うため、どんな商品を好むか分からないユーザーにも的確な商品の推薦ができるようになる。ショッピング事業に注力するヤフーには強い武器となる。

研究所外との連携で論文倍増

Yahoo! JAPAN研究所の論文数
Yahoo! JAPAN研究所の論文数

 こうした成果を伸ばす1つのきっかけが、ヤフーが2015年に新設したデータ&サイエンスソリューション統括本部(サイエンス部門)内に研究所を位置付けたこと。サービス開発に携わるデータサイエンティストらと一緒になって、研究開発を進められる。今では「論文のファーストオーサー(第一著者)がエンジニアなど研究所の外になるパターンが多い」(田島所長)と言う。

 2016年の論文数は55本と前年の26本から倍以上に増えたが、研究員は20人弱とほぼ変わっていない。サイエンス部門や事業部、大学など外部が第一著者となった論文が20本から46本へと大きく増えたことが貢献している。連携戦略が功を奏した。

 研究所で細々と始めたというAIなどに関する論文読み会も、400人近いサイエンス部門のメンバーに草の根的に広がったことで、レベルアップにつながっている。

 田島所長は研究方針を「ヤフーならではのことをやること」と「オープンにこだわる」と示す。

 オープンにこだわるのは、データから価値を生み出すアイデア、技術は研究所内だけでは限界があると考えるからだ。社内のサービス開発現場、大学に加えて、「企業との共同研究も前向きに考えていきたい」と田島所長は語る。国内有数のビッグデータを持つヤフーが、研究のハブとして存在感を高めていくかもしれない。