
マーケティングに携わるビジネスパーソンなら知っておきたい、基本的な統計用語の意味や使い方を解説する本特集。最終回のテーマは「t検定」。条件の異なる2つのグループ間に生じた“差”に意味はあるのか、偶然の産物か。数ある検定の中でも使用頻度の高いt検定について、法政大学経営学部の西川英彦教授による“超初心者レベル”の講義で学ぶ。
t検定は「対応のある・なし」の2タイプ
――「無相関検定」や「χ2(カイ二乗)検定」の講義で、「仮説検定」が何をどのように検証しているのか、大まかなイメージはつかめるようになりました。今回は「t検定」です。χ2検定では、検定統計量「χ2値」を「χ2分布」に照らし合わせることで、帰無仮説が正しいとする状況が発生する確率「p値」が5%未満かどうか調べました。ということは、t検定でも検定統計量「t値」を「t分布」を使って検証するのですか。
西川英彦教授(以下、西川) その通りです。
――だったら、同じt値やt分布を使った無相関検定は、t検定と同じものということですか。
西川 いいえ、無相関検定とt検定は異なる仮説検定です。確かに無相関検定でもt値やt分布を使います。しかし、無相関検定の講義のときに、あの計算式はあくまでも「無相関検定の相関係数を使った検定統計量である『t値』を計算するもの」である点に注意してくださいと言いましたよ。
――すいません、そうでした……。
西川 無相関検定とt検定では、検定統計量のt値に対する考え方も、それを算出するための計算式も全く異なります。
――そうなんですか。では、t検定とはどんなものなのでしょうか。
西川 t検定は「2つのグループの、ある値の平均値の差を検定する方法」です。その「2つのグループ」を「質的変数」、「ある値」を「量的変数」と呼びます。
――質的変数と量的変数?
西川 具体的に説明したほうが分かりやすいでしょう。例えば「男子学生と女子学生のテストの平均点を比較する」というケースで考えてみます。この場合、「男子学生か、それとも女子学生か」というのが質的変数で、「テストの点数」が量的変数です。
もう1つ例を挙げるとするなら、「喫煙者と非喫煙者のコレステロール値を比較する」というケースだと「喫煙者か、非喫煙者か」が質的変数で、「コレステロール値」が量的変数です。つまり質的変数は男女や喫煙者か非喫煙者かといったカテゴリーで示され、量的変数は点数や計測値など数値化できるものを表しています。
――「男子学生か、女子学生か」とか「喫煙者か、非喫煙者か」みたいなカテゴリーの場合が「質的変数」で、「点数」や「コレステロール値」のような数値で表される場合が「量的変数」なんだ。
西川 ちなみに、これまでの講義で学んだ無相関検定やχ2検定も、このt検定と同じく「2つの変数の間の関連性を調べる検定」です。ただし、扱う変数が「質的」か「量的」かに着目すると、3つとも異なります。
――どう違うのですか
西川 たとえばt検定は「質的変数と量的変数」の間の関連性を調べる検定ですが、無相関検定は「あるSNSのフォロワー数と1カ月間の投稿数との間にある相関関係」のように「量的変数と量的変数」の関連性を調べます。
――なるほど
西川 一方、χ2検定は「2種類のバナー広告とクリックのある・なし」のように「質的変数と質的変数」を検定します。
――つまり、t検定、無相関検定、χ2検定は「2つの変数間の関連性を調べる」という点で共通しているけれど、調べる2つの変数のタイプが違うわけか。
西川 そしてt検定は、サンプルの2つのグループの平均値の差を検定することで、もともとの母集団においても2つのグループの平均値に差があるかどうかを検証するのです。
――どんなことが検証できるのかは分かりました。マーケティングの現場だと、t検定はどのようなシーンで使えるのでしょうか。
西川 例えば、あるチェーン店で、店頭のPOP(店頭販促)を新商品の前に置いたとき、そのPOPがどれだけ売り上げに貢献したか確かめたいとします。そんなとき、t検定と売り上げデータを使えば、POPが効果を発揮したことで売り上げが増えたのかどうか、検証できます。
――そんなに便利な仮説検定だったのか。中身の解説をお願いします。
西川 分かりました。ではまず、χ2検定には「適合度の検定」と「独立性の検定」の2種類ありました。実はt検定にも「対応のあるt検定」と「対応のないt検定」の2つのタイプがあります。
――対応のある、ない……?
西川 難しく考える必要はありません。例えば某チェーン店で、新商品の店頭プロモーション施策として、店内放送による新商品紹介を考えたとします。運用も大変ですから、導入を決定する前に、店内放送によって売り上げが増えたかどうか検証したいとします。
――一般的には店内放送したほうが、やらないよりも売れそうですよね。
西川 この場合、チェーン展開するA店、B店、C店、D店、E店で、店内放送の「実施前」と「実施後」の新商品の売り上げデータを比較するのが「対応のあるt検定」です。
一方、チェーン店で「店内放送したA店、B店、C店、D店、E店」と「店内放送しなかったF店、G店、H店、I店、J店」の新商品の売り上げデータを比較するケースが「対応のないt検定」です。
――店内放送の効果を同じ店で調べるのと、もう一方は異なる店を使って調べるのか……。確かに比較する意味合いが変わってきそうですね。
西川 意味合いだけでなく、t検定の方法や手順も変わります。今回はt検定の意義やプロセスをざっくりとしたイメージで理解してもらうのが目的ですから、「対応のあるt検定」のほうだけ解説します。
今回も仮説検定のプロセスのおさらいから始めましょう。既に何回かやって大まかな流れをつかんでいると思いますから、ざっと読み流すだけで大丈夫ですね。
- (1)仮説検定は「実務や研究課題を解決するために立てた仮説が支持されるか」を、確率的に検証する統計的手法
- (2)自分が本当に検証したい仮説である「対立仮説」(多くの場合「差がある」あるいは「関係がある」)を否定する「帰無仮説」(多くの場合「差がない」あるいは「関係がない」)を立てる
- (3)帰無仮説の棄却で対立仮説(自分が立てた仮説)が支持されることを目指す
- (4)帰無仮説が正しいとする状況が発生する確率を調査や実験のデータを用いて調べて、その発生確率が極端に低ければ、帰無仮説を棄却できる
- (5)「p値」を調べるのに必要な「検定統計量」を決められた計算式で求める
- (6)算出された検定統計量の従う分布により、帰無仮説の状況が発生する確率「p値」を調べる
- (7)p値が「5%未満」なら帰無仮説が正しいとする状況が発生する確率が極めて低いので、帰無仮説が棄却される
- (8)帰無仮説が棄却されると、それに対する元の「自分が本当に検証したい仮説(対立仮説)」が、統計的に有意な差(あるいは関係)があるものとして支持される
――無相関検定、χ2検定に続いて3回目のおさらいですから、仮説検定の流れはかなり頭に入ってきました。
西川 では、この流れに沿って、私がつくった「発行したクーポンに効果があったかどうか」という事例をt検定で検証してみましょう。
――買い手からすると、クーポンがあれば、つい使っちゃいます。でも、発行している側からすると、値段を安くした分に見合うだけの売り上げ増があったかどうか、ぜひ知りたいところです。
このコンテンツ・機能は有料会員限定です。