ヤフーは利用者のサイト内での行動履歴などを、サービス改善や新事業の開発に生かしている。2013年春には利用者が入力した検索キーワードの履歴を用いた景気動向の予測を開始。今後は、複数サービスの情報を掛け合わせるなど、データを多角的に活用していく考えだ。

 ヤフーは利用者のサイト内での行動履歴などを、サービス改善や新事業の開発に生かしている。2013年春には利用者が入力した検索キーワードの履歴を用いた景気動向の予測を開始。今後は、複数サービスの情報を掛け合わせるなど、データを多角的に活用していく考えだ。

 ヤフーはサイト利用者の行動などから属性を推測し、適切と思われる広告を表示したり、サイトの構成を自動で最適化したりしている。

 例えば、キーワードの検索機能には米グーグルの処理エンジンを利用しているが、キーワードに応じて「Yahoo!知恵袋」「Yahoo!ファイナンス」「Yahoo!ニュース」といった自社の独自コンテンツを差し込んで表示している。また、利用者が検索結果に満足したのかを測るため、結果表示ページの滞留時間や、次の結果表示ページに直行した比率などの記録を蓄積。これらのデータを元に結果の表示やページを改善するなどで、年間75億種類のキーワードが検索されるようになった。

 2013年4月にはこれらのデータを活用して「Yahoo! JAPAN景気指数」を発表した。利用者が検索したキーワードの情報を基に、内閣府が毎月公表している景気指標の「景気動向一致指数」を事前に予測する取り組みだ。2013年3月の景気動向一致指数については、4月16日にヤフーが「91.9」と発表。その後内閣府が5月9日に公表した数値は「93.3」と2ポイント以内の誤差に収まった。

 ヤフーは検索キーワードのうち景気動向一致指数と高い相関関係を持つ196種類のキーワードを選び出して、独自のロジックで算出している。検索キーワードは75億種類のうちから常に検索されている約60万種類に絞り込んで、その中から景気動向一致指数と相関の高いキーワード206種類を選び出した。景気が上向きの「正」だけでなく、下向きの「負」の相関のキーワードも含まれている。さらに同様の正負の傾向を示すキーワードをグルーピングすることで、キーワードを196種類に絞り込んだ。

 指数の算出に悪影響を与えないよう、具体的なキーワードは公表していない。算出に使っていない、正のキーワードとしては「ターニングポイント」、負のキーワードとしては「帝国データバンク」といったものが挙げられるという。

 こうした自社データを利用した分析を「Yahoo! JAPANビッグデータレポート」として公表している。

 ヤフーはGoogle社に比べると、各サービス間でのデータ連係に余地がある。例えば、Google社はスケジュール帳のデータを基に、出発するべき時刻をユーザーに通知して目的地までのナビゲーションをしたり、飛行機のフライト状況を通知したりする統合サービスを提供している。

 ヤフーは今後、各サービスでのデータ連携を強化していく考えだ。核となるのがデータ解析や活用を担当する約230人の専門人材である。

この記事をいいね!する