
マーケティングに関わるビジネスパーソンなら知っておきたい基本的な統計用語の意味や使い方を解説する本特集。今回のテーマは「無相関検定」の前編。サンプルデータから導いた相関関係は、母集団でも同じことが言えるのか。それを検証するための重要な統計手法だ。法政大学経営学部の西川英彦教授による“超初心者レベル”の講義で学ぶ。
サンプルの分析結果は全体にも当てはまるのか
――前回の講義で取り上げた「相関分析」では、フォロワー数や投稿数、来店客数、販売個数、売上金額、気温など、企業が集計している数あるデータの中から2つの項目(変数)を選んで、その間に「一方が増えると、もう一方も増える(減る)」という相関関係が存在するかどうか、分析する方法について学びました。さらに相関分析は、その関係の強さを「相関係数」という数値で表せる、とても便利な統計手法でした。
西川英彦教授(以下、西川) 企画・立案などのビジネスの現場で非常に役立つので、多くのマーケターが相関分析を使っています。
――そんな便利で役立つ相関分析について、西川先生は前回の講義の最後で「実際にマーケティングで活用するためには、相関分析だけでは足りない」とおっしゃいました。そして、その足りないものが「無相関検定」だと。
西川 はい。
――なぜ、相関分析だけでは実際のマーケティングに活用できないのですか。
西川 たとえ相関分析で「相関関係のある・なし」や「相関関係の強さ」が分かったとしても、それはあくまでも調査や実験の対象となった「標本」つまり「サンプル」だけについての話だからです。
――サンプルだけ……?
西川 例えば、あるファストフードチェーンの本社が、顧客の来店回数と満足度との間に相関関係があるのかを知りたくて、相関分析を行うとき、全ての顧客の来店回数と満足度の全データを分析にかけるでしょうか。
――全ての顧客の来店回数と満足度の全データを集めるなんてあり得ないでしょうから、アンケートで回答をくれた顧客のデータだけを調べることになるでしょう。
西川 相関分析で使う「成人男性」とか「F1層(20~34歳の女性)」といった、性別や年代別に見た消費傾向の調査は、対象となる全員にアンケートやヒアリングを実施したものでしょうか。
――成人男性やF1層の全員なんて、人数が多過ぎるから聞けるわけありません。
西川 ですから通常の調査や実験では、対象となる集団全体、これを統計的には「母集団」といいますが、その母集団の中から一部のサンプル(標本)をとって調べるのが一般的です。
さて、一部のサンプルについて分かれば、全体が分からなくてもいいのでしょうか。
――いいえ。本当は基となる調査対象全体の傾向や特徴を知りたいはずです。しかし、全てを調査するのは無理なので、仕方なく一部を抜き出し、そのサンプルに対する調査や分析結果が全体の傾向や特徴と同じようなものだろうと推測している……それしか方法がありません。
西川 そのため相関分析で結果を出した後、「母集団でも相関関係があると言えるかどうか」を確かめなければならないのです。
――確かに「この相関分析の結果は、今回調べたサンプルでは言えますが、一般的に通用するかどうかは分かりません」なんてことになれば、実際のマーケティングの現場では使えません。
西川 相関分析で相関係数を算出して得られたのは、標本(サンプル)のデータを基に標本の特性が記述されたもので、標本の平均や分散、相関係数などの「基本統計量」です。なお、こうした手法は「記述統計」と呼ばれます。前回まで学んできた統計は、まさにこの記述統計です。この基本統計量から、本当に知りたかった母集団についての仮説の検定や、母集団の平均、分散、相関係数などの「母数」を推定するわけです。こうした手法は「推測統計」と呼ばれます。
西川 推測の結果、母集団での相関関係を主張できるのかどうか。言い換えれば、一部のサンプルのデータでは相関関係があるが、母集団でも相関関係があると言ってもよいのかどうか、検証しなければならない。その検証方法が「仮説検定」であり、今回の場合は「無相関検定」となるわけです。なお、「推定」の話は次回説明しますね。
――まずはサンプルを相関分析で調べて、その結果を基に、無相関検定で母集団でも相関関係があると検証して、初めて「2つの変数の間には母集団でも相関関係がある」と言えるわけですね。
西川 そのため、研究や先進的ビジネスの現場ではいつも相関分析と無相関検定がセットで行われているのです。
――サンプルを集計して記述した結果が、一般的にも通用するのかどうかを推測し、検証する。だから「集計」や「記述」という表現ではなく、「推測」や「検定」なんですね。
西川 そうです。では、早速、無相関検定の中身を見ていきましょう。
このコンテンツ・機能は有料会員限定です。