
マーケティングに関連した基本的な統計用語を解説する特集企画。今回は「無相関検定」の後編。相関分析をビジネスの現場で使うにはなぜ無相関検定が不可欠なのか、帰無仮説には何を立てるのかなどの解説が行われた前編に引き続き、後編ではいよいよ「検定統計量」を使い、検定の肝となる「p値」を調べる具体的な方法について、法政大学経営学部の西川英彦教授が“超初心者レベル”の講義で解説する。
検定統計量を相関係数とサンプル数で計算
西川 無相関検定の検定統計量は「t値」と呼ばれます。「t値」を求める計算式は次のようになります。ちなみに「r」は相関係数、「n」は標本数つまりサンプル数を表します。なお、これらの書体はサイトの都合上、見やすいようにレギュラーで表記していますが、厳密にはイタリック(斜体)が正しい表記の仕方になります。
――これがt値の計算式なのですね。「検定統計量」が「効果の大きさ」と「標本サイズ」を掛け合わせたものだというのは、何となくイメージできます。しかし、どうして相関係数「r」を「√1-r2」で割ると「効果の大きさ」になるのか、なぜ標本サイズは標本数から2を引いたものなのかは、よく分からないのですが……。
西川 それを説明するには、より高度な統計的知識が必要になります。今回は「ざっくりとしたイメージのレベルで分かる」ということを目指していますので、詳しい中身については機会があれば解説することにします。
――ですが、無相関検定でt値を求める場合、この計算式を使う必要があるわけですよね。その際、計算式の中身をしっかり理解していないと、計算できないのではないかと不安になってしまいます。
西川 その心配は無用です。この特集の第2回で「無料の統計ソフトがある」という話をしました。覚えていますか 関連記事:「広告に必要な「p値」とは 「有意差」がなぜそんなに大事なのか」 。
――確か大学生や大学院生も「R(アール)」という無料の統計分析ソフトを使って計算をしているという話でした。
西川 実際、そのソフトに調査や実験の数値データを入れるだけで、後はソフトが検定統計量など複雑な計算をしてくれるので、昔のように自分の手を動かして計算する必要はありません。この計算式の意味を知らないまま無相関検定を使いこなしている人もたくさんいます。あくまでも「何を計算しているのか、ざっくりとしたイメージ」さえ持てれば、それで十分です。
――なるほど……分かりました。
西川 計算式の中身を全く考えないのもどうかと思うので、イメージするのに必要な解説だけしましょう。例えばこの計算式の「=」の右側を見てください。「効果の大きさ」を表す分数の中身を見てみると、相関係数「r」が大きくなればなるほど分母は小さく、分子は大きくなる。また「標本サイズ」を表す「√」の中身はnが大きくなれば大きくなる。言い換えれば、相関係数や標本数が大きくなればなるほど、検定統計量のt値も大きくなるというイメージです。
――そうか。相関関係が強ければ強いほど、そして、扱ったサンプル数が多ければ多いほど、t値は大きくなるのか……それで、t値が大きくなると、どうなるのですか。
西川 それについては後で説明しますから、少しだけ待ってください。
――はい。
西川 ちなみに「t検定」で使う検定統計量は今回と同じ「t値」ですが、次回の講義で取り上げる「χ2(カイ二乗)検定」の検定統計量は「χ2(カイ二乗)値」、「分散分析」の検定統計量は「F値」で、それらを求めるための計算式も異なります。同じt値なのに無相関検定とt検定の間でも、t値を求める計算式は違います。ですから、こちらの計算式はあくまでも「無相関検定の相関係数を使った検定統計量である『t値』を計算するもの」である点に注意してください。
――分かりました。
西川 では、事例に沿って計算してみましょう。
このコンテンツ・機能は有料会員限定です。