楽天はEC(電⼦商取引)モール「楽天市場」をはじめとして、⾦融やデジタルコンテンツなど70以上のサービスを展開している。顧客の膨⼤なデータを有効活⽤するため、専⾨部署であるデータインテリジェンステクノロジー部を設けてマーケティングの⾼度化を進めている。

 楽天のサービスを利⽤する会員数は累計で1億1489万⼈に及び、国内取引は年間約8兆8000億円。楽天市場には4万4500店舗以上が出店している(2016年12⽉末時点)。

 会員のポイントシステムはサービスをまたがって利⽤することができ、オンライン上だけでなく、電⼦マネー「楽天Edy」に変換することなどでリアル店舗でも利⽤が可能だ。楽天会員が2サービス以上利⽤するクロスユース率は62.7%に及ぶ。こうした仕組みにより膨⼤な取引が発⽣し、⾮常に⼤きなデータが資産として蓄積している。これらを有効活⽤するために「楽天データバリューチェーン」というソリューションを構築した。

データの扱いを3つに分類

 楽天データバリューチェーンでは、データの扱いを3つに分類した。「収集」「整理」「利⽤」だ。

 収集では、どの商品が売れたかなどの「サービスデータ」と、どのように購買したかの「⾏動データ」の2つに分類し収集。整理では、集めたデータをデータマート(特定の⽬的に合わせ抽出、集計し、利⽤しやすい形に格納したデータベース)にし、使いやすい状態にしている。

 最終的にはAPI(アプリケーション・プログラミング・インターフェース)を提供し、データサイエンティストがそのAPIを使って各プラットフォームにデータをつなげる役割を果たしている。

 「利⽤」では、多岐にわたるニーズを想定しソリューションを提供している。

楽天データインテリジェンステクノロジー部データサイエンス課の馬学彬シニアマネージャー
楽天データインテリジェンステクノロジー部データサイエンス課の馬学彬シニアマネージャー

 データインテリジェンステクノロジー部データサイエンス課の馬学彬シニアマネージャーは、⽇本テラデータが5⽉に開催したイベント「TERADATA UNIVERSE TOKYO 2017」で講演し、取り組みをこう説明した。

 「経営層はKPI(重要業績評価指標)をモニターしたいだろうし、マーケティング部⾨はデータのインサイトを知りたいだろう。テクノロジー系の部署は⾃分たちで解析したいという場合もある。利⽤者の⽬的に応じたデータ提供を⾏っている。収集、整理、利⽤はそれぞれ密に関わりあっているため、フィードバックを繰り返すことが重要だ」

 また、データガバナンスチームを作り、法的な⽭盾が発⽣しないようにデータが利⽤されているか、全体をチェックしている。

 さらに提供する価値を強化するために、リアルタイムなデータの収集、ユーザーインサイトプラットフォームの構築、コンテンツの最適化などを行っている。

 ユーザーインサイトプラットフォームは「楽天カスタマーDNA」と名付けた。

 具体的には次のような2つのアプローチを取る。まず、ETL(抽出・変換加⼯・ロード)処理を⾏い、ある顧客がどのようなサービスを使い、どういうものを買う傾向があるのかを解析する。次に、機械学習によって、他に同様の購買⾏動をする顧客を⾒つけプロファイリングする。

 このプロファイルによって、サイトでのお薦め商品を切り替えるパーソナライズや、ターゲティングメールの送信数の効率化などをしている。ターゲティングを強化した後のメール開封率は5%上がったという。

バンディットアルゴリズムを活⽤

 ABテストによってコンテンツを最適化するが、膨⼤な数のモデルがあるため、テストを一つひとつ⾏うと時間もかかる。そこで、機械学習の1種であるバンディットアルゴリズムを利⽤し、迅速に最適なコンテンツを表⽰できるようにした。バンディットアルゴリズムはパフォーマンスに基づいてテストリソースを動的に割り当て、複数のテストを同時に⾏いながら、最適な選択枝を⾒極めることができる。

 ⼀例としては、楽天最⼤のキャンペーンである「スーパーSALE」で利⽤した。

 A~Fの6パターンのランディングページと、「スーパーヘビー」から「スーパーライト」までの8つのクラスターの顧客とのマッチングを最適化した。スーパーヘビーユーザーはEページが最も効果的で、スーパーライトユーザーはDページがパフォーマンスが良かったなどの知⾒が得られ、結果としてコンバージョン率(成約率)は5%向上したという。

 「こうしたユニバーサルシステムを構築していくことは⾮常に難しい。継続的に技術を改善する必要性を感じている」と、⾺⽒はさらなる改善へ意欲を⽰している。

この記事をいいね!する