事業部門で活用される主な分析手法を解説する本特集。今回は「決定木分析」「相関分析」「因子分析」の3手法の活用を取り上げる。

顧客の離反理由を決定木で追及

 個人商店や小型スーパー約1800店が加盟する国内最大のボランタリーチェーン「全日食チェーン」を運営する全日食は、データ分析を強化することで、大手スーパーやコンビニに対抗している。

 購買履歴やプロファイルに応じてデータ分析を実施して、顧客に個別のクーポンを毎月発行するのが特徴だ。顧客の購入に結びつく商品を分析し、掲載する商品を絞り込むことで、全日食のチェーン店への来店を促す狙いがある。

 ID-POSは当初、商品の自動発注のために導入したが、現在はデータ分析とクーポンに軸足を置いている。全日食チェーンの加盟店は約4割がクーポンのシステムを導入している。店舗によってはクーポンの導入によって売り上げが1割増えるケースもあるという。

 全日食の取り組みで興味深いのは、流通業が多用するクラスタリング分析を当初は多用していたが、今は主要な手法から外していることだ。今回、他業種も含めて8社中7社が選択しているにもかかわらず、だ。

 全日食はクラスタリング分析の代わりに決定木分析の活用を進めている。現在、特に離反顧客の防止に力を入れている。

 例えば、ID-POSのデータを決定木で分析すると、来店回数、青果の購入数、といった要因でツリーが作成される。「クラスタリング分析ではグループ単位に特徴の名前を付けたうえでさらに見ていく必要があるが、決定木だと要因が一目瞭然で会議などでも説明がしやすい」(五木田氏)。

【相関分析】データ間の関係の強さを明らかに

データの関係の強さを見る手法である。相関係数で判定をし、正の相関が最も強いと1、相関がないと0になる。負の相関は-1が最大だ。係数による「相関」の強弱や有無が出力となり、なぜそうなったのかの「因果」を知る手法ではない。相関係数は高くても、実際には全く関係がないこともある。それを偽相関と呼ぶ。

 SBIホールディングスはグループの企業同士の連係に相関分析を活用し始めている。金融サービスを中心にグループで約1700万の顧客を抱えており、Webサイトへのアクセスは月6億ページビューを超えている。

 主要企業のWebサイトには顧客の動きを一元的に分析するため、「グループ連携」と呼ぶタグを設定し、分析に乗り出している。

 データ分析にあたるのはSBIホールディングス社長室ビッグデータ担当の坂本卓哉氏である。今年6月にSBI損保から社長室ビッグデータ担当に転じて、それからデータ分析を集中して学び始めた。

 各社のページビューが上位のコンテンツについて、アクセスした顧客の年代や性別でクロス集計して分類。そのうえでExcelのデータ分析機能を活用して、相関分析も行った。

 坂本氏は各社のデータを根気強く掛け合わせた。およそ2カ月間かかったが、金融商品の評価やコンサルティングの「モーニングスター」と金融サービスの実店舗である「SBIマネープラザ」の相関係数の値は1に近く、顧客属性がきわめてよく似ていることを突き止めた。組み合わせによっては、相関係数が0.5以下のものもあった。

 その後は各グループ会社の判断であるが、「メールで自社のサービスを相手の顧客にレコメンドしたり、自社のサイトに来た時に相手のサービスのバナーを出してあげるといった施策が考えられる」(坂本氏)。

SBIホールディングスがグループの顧客から相関関係を見いだす手順
SBIホールディングスがグループの顧客から相関関係を見いだす手順

【因子分析】回答から顧客心理の要因を抽出

人の心理を図る尺度として使われる場合が多い。アンケートに対する消費者や顧客の回答データを分析することで、どの要因が重視されているのかが軸として導き出される。ある概念を、数個の軸に分解して説明する用途に使われることもある。要因を合成する主成分分析は、因子分析とは逆の考え方と言える。

 飲料の製造・販売を手掛けるダイドードリンコは、因子分析を新しい缶コーヒーの開発に活用している。

 同社はキャップで封ができる微糖の缶コーヒーを今年春に市場投入する際、同シリーズの既存缶コーヒーとは味を変えることにした。キャップを締めて保存できるため、風味が長い時間劣化しない。味の方向性を変えることが求められると考えたのだ。

 まず180人の消費者に競合の3製品も含めた5製品のブラインドでの試飲を実施した。この際に行ったアンケート結果のデータを因子分析することで、4つの因子が消費者の味に影響していることが分かった。

 具体的には「香り」「苦み、コーヒーの深み」「キレ」「ミルク感、甘み」の因子が抽出された。「我々がターゲットとしている消費者の頭の中で、コーヒーの味がどういう言葉でどう表現されているのか。モデル化しないことには具体的な議論ができない」(マーケティング部顧客・市場調査グループの藤村二歌氏)。

 さらにどの因子が味の総合評価に影響しているのか重回帰分析を実施。「キレ」が12.0と高い影響を与えていた。これらの分析結果を基に「キレ」と「苦味、コーヒーの深み」の軸などでプロットして評価。すべての指標で好成績な改良Bタイプの製品化を決定した。今春に投入以降、売れ行きは好調という。

ダイドードリンコは因子分析を活用し、味の方向性を決める
ダイドードリンコは因子分析を活用し、味の方向性を決める

結果の「検定」が再び重要に

 「導き出した分析結果が実際に効果あるのか。検定が今再び重要になっている」と言うのはリクルートライフスタイルの前田氏である。

 そこで重要となる効果検証の手法がA/Bテストである。Webサイトであれば、AとBの2パターンのページを準備し、顧客の商品購入率など効果に有意な差があるか見極める。

 例えば、夫婦で宿泊する顧客にBというオファーで購入に結びつけるキャンペーンを作ったとする。それに対して通常のAというパターンのページを提示した際の購入量も定量的に把握して比べないと、実際の効果は見極められない。

 差が出たとしても「それが有意なものかどうかが問われる。検定手法について、グループのデータサイエンティストに聞きながら、自らも勉強をし始めた」(前田氏)。

 今回紹介したデータ分析担当者のほとんどが、統計分析スキルのバックグラウンドを持っていなかった。現ポジションに就いてから学んでいる。ではどのように習得したのか。

 SBIは社長室のビッグデータ担当者で朝の勉強会を開いており、村田製作所ではモノづくり技術統括部の下八重修氏らがデータ分析の100ページ以上のテキストを作って「データマイニング研修」の講習会を開催するなどしている。

 今回紹介した各社とも、創意工夫を重ねて事業部門にデータ分析力を組み込んでいる。実際にデータ活用を進めていくと、複数データの結合で苦労をしたり、欠損している情報を補うノウハウも求められる。

 事業部門であれば、実際に使っているデータで分析の切り口を立てやすい。半年もすれば分析できるようになるというのが、各社の共通見解だ。まずはクロス集計やクラスタリング分析など、誰もが使う手法からスタートしてはどうだろうか。

この記事をいいね!する