続・文系マーケターのための統計入門 第9回

マーケターなら知っておきたい統計的手法の基本を解説する本特集。今回は重回帰分析の最終講義。分析の妨げになる「第3の変数」があると回帰モデルで正しい因果関係が検証できない。その問題を「コントロール変数」を使って解決する方法について、法政大学経営学部の西川英彦教授に解説してもらった。

重回帰分析において「第3の変数」は要注意。その問題を「コントロール変数」を使って解決する(画像提供:Piscine26/Shutterstock.com)
重回帰分析において「第3の変数」は要注意。その問題を「コントロール変数」を使って解決する(画像提供:Piscine26/Shutterstock.com)

統計的に支持されても正しく検証できない

――これまでの3回にわたる講義で、重回帰分析がどれほどマーケティングに役立つのか納得できました。今回の講義はいよいよ「重回帰分析の解説の流れ」の最後の「(7)別の原因の影響をコントロールする」についてですね。

西川英彦教授(以下、西川) 重回帰分析は、マーケティングの実務でも研究分野でも使われる頻度の高い統計的手法の1つです。しかし、多重共線性など解決すべき問題もあり、使い方も多岐にわたるため全体像を理解するのは簡単ではありません。

 重回帰分析の解説はこれで最後となりますが、ここで改めて「重回帰分析の解説の流れ」を確認しておきましょう。この順番は解説を分かりやすくするためのもので、重回帰分析を実際に行う手順とは異なるので、気を付けてください。

【重回帰分析の解説の流れ】

(1)複数の原因と結果の仮説を立てる
(2)回帰式「y=a1x1+a2x2……+b」を導き出す
(3)母集団でも、各原因を使うのが適切かを検定する
(4)回帰式の精度を確かめる
(5)かぶりの問題を確認する
(6)どの原因が予測結果に利いているのかを調べる
(7)別の原因の影響をコントロールする

――前回の講義の最後に先生は「(7)別の原因の影響をコントロールする」について、「実際に重回帰分析を行うとき、最初に仮説を立てたら、次に行うほど非常に重要なプロセスです」と説明されました。なぜ、別の原因の影響を“コントロールする”ことが、それほど重要なのですか。

西川 マーケティング戦略を考える際、マーケターは実際に調査や施策を打つ前に、得られる結果や反応を予測して、必ず「仮説」を立てますよね。

――どんなケースでもまずは仮説を立てて、必要なデータを集める。そのデータを様々な統計的手法を使って解析し、仮説が統計的に支持されることが分かったら、それを基に具体的な施策を実行する……という流れですね。

西川 ところが回帰分析の場合、仮説を基に導き出した回帰モデルの分析結果が統計的に支持されたとしても、別の原因の影響によって、その回帰モデルでは仮説の正しい因果関係が検証できない可能性もあるのです。

――回帰モデル自体は統計的に支持されたのに、正しい因果関係が検証できないなんて、そんなことあり得るんですか。

西川 はい。だからこそ実際の手順では多くの場合、仮説を立てると同時に、別の原因の影響を“コントロール”しなければならないのです。

――そこまで深刻な問題を起こす「別の原因の影響」って、どんなものなんですか。

西川 それについては具体的な事例を基に解説しましょう。

回帰モデルが支持されただけでは不十分

西川 例えば「ユニクロ」や「無印良品」、あるいは「スターバックス」のような、店舗運営と製品販売を手掛ける企業のマーケターが、自社ブランドに対する消費者の「ブランド態度」について調査・分析して、新たなマーケティング戦略を立てようと考えたとします。

――ブランド態度は、消費者がブランドに対して持っている「選好」、平たく言えば「好きの程度」で決まるものですね。消費者のブランドに対する意見や潜在的な評価の表明とも考えられるので、マーケティング戦略を考える上で重要な指標の1つとされています。

西川 そこでマーケターは新たな戦略の重点項目を決めるため、まず「店舗環境の評価は、ブランド態度に影響する」「商品の評価は、ブランド態度に影響する」という仮説を立てました。

――その仮説が支持されたら、「ブランド態度」の向上という目標を達成するためには「店舗環境」と「商品」に資金や人手を集中させればよいという方針が立てられますね。

西川 この仮説を検証するため、マーケターは顧客にアンケート調査を行い、自社ブランドの「店舗環境」「商品」「ブランド態度」や、その他の様々な項目について7段階のリッカート尺度で回答してもらい、データを収集しました。

――例えばブランド態度の場合だと「好きの程度」を尋ねる7段階の「とても好き」「好き」「やや好き」「どちらでもない」「やや好きではない」「好きではない」「まったく好きではない」から答えを選んでもらって、「まったく好きではない=1点」から「とても好き=7点」までの点数として評価するのですね。

西川 1つの質問項目で調べるなら、そうです。そして、商品、店舗環境とブランド態度がひも付けられた評価点数のデータを基に、統計解析ソフトで重回帰分析して回帰モデルを導き出すことで、マーケターはブランド態度に対する商品と店舗環境の因果関係の有無や影響の大きさについて検証したとします。

 その「店舗環境(shop)」「商品(product)」「ブランド態度(brand)」の評価点数の関係を簡略に示したのが次の図です。

(画像提供:tetiana_u/Shutterstock.com)
(画像提供:tetiana_u/Shutterstock.com)

――店舗環境と商品からブランド態度に向かって「+(プラス)」の影響が矢印で示されています。これは重回帰分析の結果、顧客の店舗環境や商品の評価が高まると、ブランド態度の評価も高まるということを表しているのですね。

西川 はい。

――つまりデータを重回帰分析した結果、仮説の「店舗環境の評価は、ブランド態度に影響する」「商品の評価は、ブランド態度に影響する」という因果関係が検証できたわけだ。

西川 いいえ、まだ正しい因果関係が検証できたとは限りません。

――検証できたとは限らない? でも、図には店舗環境と商品からブランド態度に向かって「+」付きの実線の矢印が出ています。つまり、ブランド態度には店舗環境と商品の評価が影響するってことじゃないですか。それとも回帰モデルの決定係数が低すぎたり、あるいは多重共線性の問題が起こったりしたのですか。

西川 いいえ、回帰モデルの偏回帰係数や決定係数などは、統計的に有意である条件をすべてクリアしました。しかし、この回帰モデルでは正しい因果関係が検証できない可能性があるのです。

――何でそんなわけの分からないことが起こるんですか。

西川 理由は、まだ「第3の変数」の影響がコントロールされていないからです。

――第3の……変数?

このコンテンツ・機能は有料会員限定です。

4
この記事をいいね!する