この連載では、マーケティングの仕事をする上で必要となる各種の計算式を解説してきた。最終回の本記事では、測定したデータを分析するための「統計学」にまつわる基礎的な計算式を紹介しよう。いくつか数式が登場するが、簡単な例題に挑戦していくうちに徐々に慣れていくはずだ。

(写真提供/Shutterstock)
(写真提供/Shutterstock)
前回(第3回)はこちら

 統計学は売り上げや顧客の数など膨大なデータを分かりやすく比較したり、意味を見いだしたりするために必要となる。ここでは基本となる分散や標準偏差などの意味を大づかみで理解できるように紹介していこう。統計学をうまく活用することで、データの正確さを検証する、意味のある情報を抽出する、さらには正しいデータを予測するといったことも可能になる。さまざまな分野で使われるようになったAI(人工知能)も、統計学の手法をベースとしているものがある。

今回取り上げる統計学の基礎的な計算式
  • 平均値
  • 中央値
  • 分散
  • 標準偏差
  • 95%信頼区間

 平均値 

平均値(Average)

計算式:

【用語解説】
数多くのデータを取り扱う時、データ数が多いと全体像が見えなくなってしまう。そこで平均値を計算すれば、全体像を把握できる。一般的な平均値の計算方法は、全データの値を足し算して合計をデータの個数で割る方法。これを算術平均という。

平均値は極端な異常値が入ると大きく左右されやすいので注意。例えば、平均資産1000万円の100人のグループに、資産19兆円のジェフ・ベゾスが1人加わるだけで、資産の平均値はいきなり1881億円に跳ね上がる。

【例題】
A社は販促イベントを企画しています。過去のイベント参加実績をもとに平均値を計算し、参加者を見積もることになりました。過去1年間のイベントの参加者は、101人、80人、90人、120人、75人でした。平均値はいくらでしょうか?

【答え】
(101+80+90+120+75)÷5=93.2
平均値 93.2人

 中央値 

中央値(Median)

計算式:
データを大きさの順に並べたときに、中央にくる値。データ個数が偶数の場合は、中央にくる2つの値の算術平均値を取る

【用語解説】
平均値と同様に、数多くのデータを扱うときに全体像を把握するための方法。データの値を大きさの順に並べて、その中央にくる値が中央値となる。極端な異常値が入っても、その影響を排除できる利点がある。

【例題】
この部屋にいる10人の資産は次の通りでした。中央値を求めましょう。

  • Aさん:50万円
  • Bさん:100万円
  • Cさん:300万円
  • Dさん:500万円
  • Eさん:700万円
  • Fさん:750万円
  • Gさん:800万円
  • Hさん:1000万円
  • Iさん:1200万円
  • Jさん:1兆円

このコンテンツ・機能は有料会員限定です。

有料会員になると全記事をお読みいただけるのはもちろん
  • ①2000以上の先進事例を探せるデータベース
  • ②未来の出来事を把握し消費を予測「未来消費カレンダー」
  • ③日経トレンディ、日経デザイン最新号もデジタルで読める
  • ④スキルアップに役立つ最新動画セミナー
ほか、使えるサービスが盛りだくさんです。<有料会員の詳細はこちら>
7
この記事をいいね!する