続・文系マーケターのための統計入門 第5回

マーケティングに関わるビジネスパーソンなら知っておきたい統計の基本を解説する本特集。今回は「単回帰分析」の後半戦。分析で導き出した回帰式を使えばどれくらいの精度で予測できるのかなど、マーケティングの実務に役立てる前に欠かせないチェックポイントについて、法政大学経営学部の西川英彦教授による統計の超初心者向け講義で学ぶ。

回帰分析の結果は、信頼できる予測と言えるのだろうか?(画像提供:Yellow_man/Shutterstock.com)
回帰分析の結果は、信頼できる予測と言えるのだろうか?(画像提供:Yellow_man/Shutterstock.com)

サンプルだけでなく一般的に通用するか

――ここまでの講義で、独立変数が1つの場合の「単回帰分析」によって「原因となる独立変数から、結果となる従属変数を予測する回帰式」の導き出し方が理解できました。

西川英彦教授(以下、西川) 念のためもう一度、単回帰分析の解説の流れを確認しておきましょう。

【単回帰分析の解説の流れ】

(1)1つの原因と結果の仮説を立てる
(2)回帰式「y=ax+b」を導き出す
(3)母集団でも、この原因を使うのが適切かを検定する
(4)回帰式の精度を確かめる

――この「(2)回帰式『y=ax+b』を導き出す」がイメージできるようになりましたから、次は「(3)母集団でも、この原因を使うのが適切かを検定する」ですね。

西川 では、その検定方法について解説しましょう。

 ある飲料メーカーの開発者が「ドリンクの味の良さは売上本数に影響を与える」という仮説を立てました。これを検証するため、自社が過去に販売した20種類のドリンク商品を対象に、味覚テストの評価と売上本数との関係について単回帰分析を行い、次のような回帰式が導き出されました。ちなみに、単回帰分析の回帰式は「単回帰式」とも呼ばれます。

――この1次方程式の独立変数に、新たに開発したドリンクの味覚テストの評価点数を入れれば、売上本数の予測が出るのでしたね。

西川 そうです。ただしその前に、この回帰式の独立変数がサンプルだけでなく、一般的な対象、いわゆる「母集団」についても適切であるのか確かめる必要があります。

――もし独立変数が母集団では通用しないと判定された場合、その独立変数は使わないので、回帰式を導き出すこともない……それくらい、大切な検証ということでしたね。

西川 その通り。

――基礎編の相関分析で相関係数「r」を算出したときも、「この分析結果が母集団についても言えるか」を無相関検定で検証しました。

西川 そう、この考え方です。

――ということは、無相関検定の場合と同じように、ここでも仮説検定を行うわけですか。

西川 その通り。仮説検定のやり方は「無相関検定」の講義でも「t検定」の講義でも解説しましたから、もう大丈夫ですよね。

――はい……たぶん。

西川 ちなみに概略だけ紹介すると、まず「単回帰分析で導き出された回帰式の独立変数の係数(回帰係数)がゼロである」という帰無仮説を立てて、その発生確率であるp値が5%未満であることを確かめて、帰無仮説を棄却することで「回帰式の独立変数の係数はゼロではない」という対立仮説が支持されて、この回帰式の有意性が検証されます。

 今回の事例で取り上げた、味の評価点の係数に対するp値を統計解析ソフトで計算すると「0.00000015」になりました。

――なるほど、「1%水準で有意」という判定ですね。

西川 さらに厳しい「0.1%水準で有意」と言えます。あとは「95%の信頼区間」も確認すれば、この回帰式を使えるかどうか判断できます。

――その「95%の信頼区間」も無相関検定の講義で出てきましたね。「求められた予測区間のうち95%が、母数を含むような区間」を確かめるのでした。

西川 はい。「95%の信頼区間」については無相関検定のところで既に解説しました。要は母集団での回帰係数、つまり母数を推定するために95%の信頼区間を計算して、その間に「0(ゼロ)」が含まれていなければいいわけです。今回は多くの研究者やマーケターが使っている統計解析ソフト「R(アール)」で計算した結果を見てみましょう。

このコンテンツ・機能は有料会員限定です。

7
この記事をいいね!する