
文系マーケターやマーケティングに興味のあるビジネスパーソンが“これだけは知っておきたい”基本的な統計用語の意味や使い方を解説する本特集。最初のテーマは「標準偏差」。統計的手法には欠かせない「サンプルのばらつき具合」を数値で表す便利な指標について、法政大学経営学部の西川英彦教授による“超初心者レベル”の講義で学ぶ。
なぜ「平均値」だけでは不十分なのか
――「文系マーケターのための統計入門」では、マーケティングに携わるビジネスパーソンが、統計用語に関する意味や役割を大まかにイメージできるくらいまでかみ砕いて解説してもらいます。今回のテーマ「標準偏差」では、どんなことが学べるのでしょうか。
西川英彦教授(以下、西川) 標準偏差とはどういうもので、なぜ必要なのかについて話す前に、まずは「なぜ平均値だけでは不十分なのか」という話から始めましょう。
Aという店舗で商品の「ヨーグルト」の仕入れについて、店主が悩んでいるケースを考えてみます。A店の1週間の売り上げデータが次のような場合、仕入れる量はどう計算すればいいでしょうか。
――「平均」を出せばいいのではないですか。1週間の売上個数の合計が「39+41+38+39+40+42+41=280」「280÷7=40」で平均40個ですから、毎日40個仕入れれば、欠品も売れ残りも最大2個で、販売機会損失も在庫も最小限に抑えられます。
西川 では、同じく1週間の合計が280個のB店の場合はどうでしょうか。実はB店の1週間の売り上げは、次のような“ばらつき”があります。
――B店の場合、毎日平均の40個を仕入れても、日曜日は23個の不足、火曜日は12個も余ってしまいます。
西川 つまり、このケースでは「平均」だけ考えればいいというわけではなく、ばらつきも考慮しなければデータは役に立たないわけです。では、どれほどばらつきがあるか、どう計算すればよいでしょうか。
――それぞれの日の売上個数が平均からずれた個数を調べて、1週間分、合計すれば何か分かりそうな気がします……。
西川 その「平均からのずれ」のことを、統計の世界では「偏差」と呼びます。では、B店の偏差を合計してみましょう。
――偏差を合計するとゼロになりました。
西川 単なるずれ、つまり偏差のままだとプラス分とマイナス分が打ち消し合って、ゼロになってしまいます。そこで、各偏差を2乗してから足してみてください。
――マイナスの数値も2乗すればプラスになるため、合計はゼロにならないし、プラスとマイナスの両方のばらつき度合いが表現できそうですね。
西川 ただし、その合計だと計算する項目の数、つまり「サンプル数」が多くなればなるほど数値が大きくなってしまい、扱いづらくなります。そこで、今度はそのばらつき(偏差)の合計の平均を取ってみましょう。この偏差の2乗和の平均値は、どれだけばらついているかということで「分散」と呼びます。
――この「分散」の値が大きければばらつきも大きく、小さければばらつきも小さいというわけですね。だいぶ分かりやすくなりました。
西川 しかし、まだゴールではありません。分散を求める場合、元の偏差を「2乗した値」を使っているため、元の単位、例えばヨーグルトなら「個」という単位とは異なってしまいます。
――単位が異なる? どういう意味でしょうか。
このコンテンツ・機能は有料会員限定です。
- ①2000以上の先進事例を探せるデータベース
- ②未来の出来事を把握し消費を予測「未来消費カレンダー」
- ③日経トレンディ、日経デザイン最新号もデジタルで読める
- ④スキルアップに役立つ最新動画セミナー