楽天は膨大な顧客データを有効活用するために「楽天データバリューチェーン」を構築し、★データインテリジェンステクノロジー部が中心に全社での活用を支えている。データサイエンス部データサイエンス課シニアマネージャーの馬学彬氏が、5月23日に開催された日本テラデータのイベント「Teradata Universe」で明かした。
楽天はEC(電子商取引)モールの「楽天市場」だけでなく、金融やデジタルコンテンツなど70以上のサービスを展開している。会員数は累計1億1489万人(2016年末時点、以下同)に及び、国内取引は年間8兆8000億円(金融サービス含む)。楽天市場には約4万4500店舗が出店している。楽天会員が2サービス以上利用する比率は62.7%にも及ぶ。
こうした仕組みにより膨大な取引が発生し、非常に大きなデータが資産として蓄積している。これらを有効活用するために同社は、楽天データバリューチェーンというソリューションを構築した。
データの価値化へ3ステップ
同バリューチェーンでは、データの扱いを3つのステップに分類した。「収集」「整理」「利用」だ。
「収集」段階では、サービスによってソリューションやスキーマの違うデータをとりまとめることが難しい。どの商品が売れたかなどのサービスに関するデータと、どのように購買したかの行動に関するデータの2つに分類して収集している。
「整理」では、収集データを、特定の目的に合わせ抽出、集計し、利用しやすい形に格納したデータマートにして、使いやすくしている。API(アプリケーション・プログラミング・インターフェース)も提供しており、データサイエンティストがプラットフォームを通して、利用者へとデータの価値を届けられるようにしている。
「利用」では、様々な利用者を想定しソリューションを提供している。
馬氏は、「経営層はKPI(重要業績評価指標)をモニターしたいだろうし、マーケティングはデータのインサイトを見たいだろう。テクノロジー系の部署は自分たちで解析したいという場合もある。利用者の目的に応じたデータ提供をしている。収集、整理、利用はそれぞれ密に関わりあっているため、フィードバックを繰り返すことが重要だ」と話す。
また、データガバナンスチームを作り、法的な問題が発生しないようにデータが利用されているか、全体をチェックする取り組みもしている。
メール開封率を5%向上
さらなる価値提供の強化として行っているのが、リアルタイムにデータを収集し、顧客のニーズを予測、コンテンツを最適化することだ。これを「楽天カスタマーDNA」と名付けている。
まず、ある顧客がどのようなサービスを使い、どういうものを買う傾向があるのかを解析する。次に、機械学習を使い、他に同じような購買行動をする顧客を見つけてプロファイリングする。このプロファイルを共有し、トップページでのお薦め商品を切り替えるパーソナライズや、メール配信のターゲティング精度を高めて配信数を効率化するなどしている。メール開封率は5%上がったという。
コンテンツの最適化にはABテストをするが、膨大な数のモデルがあるため、テストを1つひとつ実施すると時間がかかる。そこで、機械学習の一種であり、テストリソースを動的に割り当てるバンディットアルゴリズムを利用した。複数のテストを同時に進めながら、最適な選択肢がどれかを見極める。
最大のキャンペーンである「楽天スーパーSALE」では、A〜Fの6パターンのランディングページと、スーパーヘビーからスーパーライトまでの8つの顧客クラスターとのマッチングを最適化するために利用した。スーパーヘビーユーザーはEページが最も効果的で、スーパーライトユーザーはDページがパフォーマンスが良かったなどの知見が得られ、結果としてコンバージョン率は従来比で5%向上した。

データ分析を外部提供
これらのソリューションは、「楽天カスタマージャーニーマネージャー」と名付けたパッケージソリューションとして、外部のクライアント企業にも提供している。
楽天の顧客とクライアント企業の顧客とで重複する特性を見つけ、どのような特性がクライアントのサービスに重要かを見極める。そして、クライアントの新規顧客獲得、ターゲット層へのクーポン提供などの目的に合わせて、顧客リストを提供する。また、楽天社内と同様の手法でコンテンツ最適化も可能となる。
「こうしたユニバーサルシステムを構築していくことは非常に難しい。継続的に技術を改善する必要性を感じている」と、馬氏は楽天データバリューチェーンから外部提供までデータを価値化するエコシステムの拡大に意欲を示した。