続・文系マーケターのための統計入門 第7回

マーケティングに関わるビジネスパーソンなら知っておきたい基本的な統計用語の意味や使い方を解説する本特集。今回は4回にわたる「重回帰分析」の講義の2回目。新商品などの売り上げの目安となる予測が導ける重回帰分析を使いこなすには、どうしても越えなくてはならない壁があった。この「多重共線性の問題」について、法政大学経営学部の西川英彦教授に分かりやすく解説してもらった。

天気や気温など様々な要因が組み合わさって変化する売り上げ。重回帰分析で予測できるというけれど……(画像提供:Gannvector/Shutterstock.com)
天気や気温など様々な要因が組み合わさって変化する売り上げ。重回帰分析で予測できるというけれど、集めたデータ同士が影響し合うことはないのだろうか……(画像提供:Gannvector/Shutterstock.com)
▼読者の皆様へ 日経クロストレンド有料会員の皆様は本特集の基礎編となる「文系マーケターのための統計入門(全10回)」も併せてお読みいただけます。ぜひご覧ください。

「多重共線性の問題」があると回帰モデルが使えない

――前回は重回帰分析の「因果関係の仮説モデル(回帰モデル)」と、そこから「回帰式」の導き出し方を学びました。また、その回帰モデルがサンプルデータだけでなく、母集団においても適切であるのかどうか、つまり一般的にも使えるのかを確認しました。さらに予測の精度の確かめ方についても学びました。今回は単回帰分析にはなくて、重回帰分析にしか起こらない「(5)かぶりの問題を確認する」という話ですね。

西川英彦教授(以下、西川) はい。まずは「重回帰分析の解説の流れ」を確認しておきましょう。

【重回帰分析の解説の流れ】

(1)複数の原因と結果の仮説を立てる
(2)回帰式「y=a1x1+a2x2……+b」を導き出す
(3)母集団でも、各原因を使うのが適切かを検定する
(4)回帰式の精度を確かめる
(5)かぶりの問題を確認する
(6)どの原因が予測結果に利いているのかを調べる
(7)別の原因の影響をコントロールする

――「かぶりの問題を確認する」ということですが、そもそも「かぶりの問題」とはどんな問題なんでしょうか。

西川 ここまでは統計の初心者にも伝わりやすいように「かぶりの問題」と呼んできましたが、正式名称は「多重共線性の問題」と言います。これを解決しなければ、その「回帰モデル(回帰式)」は使えなくなります。

――せっかく仮説を基に導き出した回帰モデルが使えなくなっちゃうんですか。

西川 はい。

――「多重共線性がある」ってそんなに深刻な問題なのか……。それって、どういった場合に起きるのですか。

西川 回帰モデルが成立するには、満たさなければならない“前提”があります。その前提が崩れたとき、多重共線性の問題が起こります。

――回帰モデルの“前提”が崩れたとき?

西川 はい。それは次のような“前提”です。

重回帰分析によって導き出された回帰モデルに含まれるすべての独立変数は、それぞれ独立している。

――独立変数が独立しているのは、回帰モデルを一目見れば分かりますよ。

西川 見た目の話ではありません。「独立している」というのは「他の独立変数の影響をほとんど受けない」という意味です。

――他の独立変数の影響を受けないって言われても、よく分かりません。

西川 そのことについては、前の講義でも紹介したドリンク開発の事例を使って説明しましょう。

――お願いします。

偏回帰係数の計算は独立変数が独立するように

西川 開発者は「味の評価点数」に加え、「GRP(テレビCMの延べ視聴率)」と「配荷率(店頭カバー率)」という3つの独立変数を使って、従属変数である「ドリンクの売上本数(百万本)」を予測する回帰モデルを導き出しました。それは次のような式になりました。

y(ドリンクの売上本数)=14.4x1(味の評価点数)+0.017x2(GRP)+91.0x3(配荷率)-173.8

――この回帰モデルは、前回の講義でも紹介しましたね。

西川 重要なのは、この回帰モデルがどういう特徴(性質)を持っているのかということです。

――特徴?

このコンテンツ・機能は有料会員限定です。

6
この記事をいいね!する