文系マーケターのための統計入門 第8回

マーケティングの実務に必須の基本的な統計手法と用語を解説する特集企画。今回のテーマは「χ2(カイ二乗)検定」。2行2列のクロス集計表を使い、例えば「男性、女性」と「購入あり、購入なし」といった2組のカテゴリーの間に関係性があるかを検証できるχ2検定について、法政大学経営学部の西川英彦教授が“超初心者レベル”で解説する。

2つの候補を検討する際に行われるABテスト。一般的な手法だが、そこで得られたデータの「差」に意味はあるのか ※画像はイメージ(画像提供:Andrii Symonenko/Shutterstock.com)
2つの候補を検討する際に行われるABテスト。一般的な手法だが、そこで得られたデータの「差」に意味はあるのか ※画像はイメージ(画像提供:Andrii Symonenko/Shutterstock.com)

「独立性」と「適合性」の2タイプの検証が可能

――今回のテーマは「χ2(カイ二乗)検定」です。初めてこの名前を見たときは、てっきり「x(エックス)2乗」だと思いました。

西川英彦教授(以下、西川)  「χ(カイ)」はアルファベットの「x」に対応するギリシャ文字で、形もそっくりなので間違えても仕方ありません。

――「χ」にはどんな意味があるのですか。

西川 はっきりと分かってはいませんが、一般的には、少なくとも「χ」自体に数学的に重要な意味が込められてはいないと言われているようです。

――何だ、がっかりです。

西川 しかし「χ2」の「2乗」の部分については、ちゃんと意味がありますよ。それについては後で説明しますね。

――前回の講義で学んだ「無相関検定」は「2つのデータの間に相関関係があるか」を検証する検定でした。この「χ2検定」を使うと何が分かるのですか。

西川 簡単に言うと「割合を検討するための統計手法」です。

――割合を検討する?

西川 無相関検定では、「来店客数」「販売個数」「売上金額」「気温」などの数量化できる「量的変数」の間に関係があるのかどうかを検証しました。それに対して「χ2検定」では、「男女」や「既婚・未婚」「日本人・米国人」「購入の有無」など、カテゴリーで示される「質的変数」の間に関係があるのかどうかを検証することができます。具体的には、それらの「割合の差」を検定します。ちなみにχ2検定には「適合度の検定」「独立性の検定」の2つのタイプがあります。

――2つのタイプは、どう違うのですか。

西川 まず適合度の検定ですが、これは「事前に分かっている理論的割合と、実際に得られたデータの割合との違い」を検討するための手法です。

――事前に分かっている理論的割合?

西川 例えば、ある新製品のパッケージデザインの候補としてパターンAとパターンBをつくって、どちらが好みか、消費者100人に実験調査を行ったとします。このとき、「事前に分かっている理論的割合」は「パターンAか、パターンBか」の半々、両方とも割合が「0.5」になるはずです。つまり、理論的にはパターンAも、パターンBも50人ずつが選ぶはずです。

――2つのうちの1つを選ぶのですから、理論的にはそうなりますね。

西川 しかし、調査の結果、パターンAが好きな人は60人、パターンBが好きな人は40人でした。

――そんなに差が付いたのですか。

西川 この割合の差を統計的に考えた場合、果たして「パターンA」と「パターンB」というパッケージデザインの違いが「消費者が選んだ割合」に影響したのか、それとも今回偶然ついた差なのか、ということが重要になってきます。

――確かに、たまたま「パターンA」を好む結果になることも、全くないとは言えませんからね。

西川 そこで、事前に分かっている理論値と照らし合わせ、この60人と40人という割合の差に意味があるのか、つまり「新製品のパッケージデザインのパターンAとパターンBが好まれる割合の差は有意か、有意でないか」を統計的に検証するのが適合度の検定なのです。実際にこのデータを分析すると、統計的に有意な差(有意水準5%)になります。

――理論値と適合しているかどうかを調べる、というわけですね。直感的にも有意な差がありそうに思えますが、χ2検定の適合度の検定を使えば統計的な手法で検証できるわけか。便利ですね。

西川 このように適合度の検定も非常に役に立つ検定なのですが、基本的な考え方や手法は似ているので、今回は独立性の検定を取り上げて解説しようと思います。

――独立性の検定は、どんな検定なのですか。

西川 適合度の検定は、調査や実験で得られたデータが、理論的割合とどれくらい適合するのかを検証します。例えば事例のように商品選択の割合とか、過去の売り上げの男女比とか、あるいはサイコロの出目がそれぞれ6分の1の確率とか、日本人の血液型の割合などのように「事前に分かっている理論的割合」と比較して、実際に観測されたデータの割合がどれだけ適合しているのかを検証するのです。

――調査や実験で得られたデータが、どれだけ理論値に近いかを調べるのか。でも、実際には「理論値とは適合していない」ということを確かめたいわけですよね。あるサイコロが“いかさま”だったとか……。

西川 まあ、そうです(笑)。一方、独立性の検定は、調査や実験で得られたデータの中から2つのカテゴリー(変数)を選んで、その2つを組み合わせたデータが関係しているのかどうかを検証します。例えば「製品A」と「製品B」について「買うか」「買わないか」の割合を見る、あるいは「旧製品」と「新製品」について「好きか」「嫌いか」の割合を調べるなど、グループ間に「割合の差」があるのかを見て、その差が大きければ、グループの違いと割合の差に、何らかの関係があると言えます。つまり、「製品A・Bの違いは、購入意向の差に関係している」や「新旧製品の違いは、人気度の差に関係している」となります。

――なるほど、分かりました。でも、何だか難しそうですね。

西川 実際にやってみれば、それほど難しくありませんよ。では、もっと簡単な言い方に替えましょう。独立性の検定は「クロス集計表の表頭(ひょうとう)と表側(ひょうそく)の関係性を探る検定」です。

――クロス集計表の表頭と表側?

西川 では、マーケティングの現場でも役立つ、簡単な事例で解説しましょう。

男性と女性でパッケージの好みに差が出る?

西川 先ほどの適合度の検定の事例では、ある新製品のパッケージデザインについて、パターンAとパターンBのどちらが好きか消費者100人に実験調査をしました。どちらか一方を選ぶ確率は理論的には半々なので、それとの比較で調査結果によって生じた割合の差が有意な差かそうでないかを調べようというわけです。

――もし、有意でなかったら、パッケージデザインのパターンA・Bに人気の差があるとは言えない、となるのですね。

西川 独立性の検定の事例では、少し手を加えますね。今回もある新製品のパッケージデザインについて、パターンAとパターンBのどちらか消費者に選んでもらいます。ただしこちらは性別を分け、男性150人、女性150人の合計300人の消費者に実験調査を実施し、「男性と女性では、パターンAとパターンBを好む割合に差があるか」について検証します。

――つまり「男性と女性とでA・Bを好む度合いが変わるか」を検証できるのですか。

西川 そうです。

――それが可能なら、購買層を男性と女性に分けたマーケティング戦略が立てられますから、かなりありがたいですね。

西川 でしょう。それでは、この調査結果をクロス集計表にして見てみましょう。

このコンテンツ・機能は有料会員限定です。

有料会員になると全記事をお読みいただけるのはもちろん
  • ①2000以上の先進事例を探せるデータベース
  • ②未来の出来事を把握し消費を予測「未来消費カレンダー」
  • ③日経トレンディ、日経デザイン最新号もデジタルで読める
  • ④スキルアップに役立つ最新動画セミナー
ほか、使えるサービスが盛りだくさんです。<有料会員の詳細はこちら>
14
この記事をいいね!する