近年注目されている地理空間データでは、地域の区分が分析や解釈に影響を及ぼすことが知られている。これは「可変地理単位地区問題」と呼ばれる。今回はこの問題がどのようなものか、2019年の新宿区の地価公示データを用いて説明する。

2019年の新宿区の地価公示データを用いて、地理空間データでは地域の区分によって、分析や解釈に影響を及ぼす事実を今回は紹介する(写真/Shutterstock)
2019年の新宿区の地価公示データを用いて、地理空間データでは地域の区分によって、分析や解釈に影響を及ぼす事実を今回は紹介する(写真/Shutterstock)

実は日ごろから実践している地理空間分析

 時系列分析では、データを時間の切り口で分析するが、切り口は時間だけではない。例えば地理空間なら、データが生成された地点やエリアとの関係を分析できる。

 多くの人は、地理空間分析を日常的に実行している。「近所のスーパーの豆腐は全国平均より安い」と思った際には、近所(とそれ以外)をエリアとして捉え、データの関係を考察している。「地方は過疎化が進んでいる」と考えたのならば、地方(とそれ以外)というエリアで分析している。誰もが、地図上にデータをプロットしなくても、地理空間を分析している。

 データと場所の関係は、行政区画を使って考察することが多い。例えば、「東京都の人口が一番多い」「平均売り上げが最も多いのは大阪府だ」といったケースだ。都道府県ではなく、区分の単位を少し細かくして「東京都新宿区の地価は高い」「東京都新宿区歌舞伎町の居住人口は多くはない」など、市区町村や町字(まちあざ)の単位とすることもある。

 行政区画を使うメリットは何か。まず、身近な地域分割であり分かりやすい。出生届や死亡届は市役所や区役所に届けるし、小学校の地理の時間には都道府県を暗唱する。一般常識や社会通念なので想起しやすく、他人に改めて説明する必要もない。多くの人にとって理解されやすいのだ。

 扱いやすい点も挙げられる。顧客管理を目的としたデータベースでは、個人の名前と行政区画(例えば住居表示)のデータがひもづいて登録されているし、調査結果の多くも行政区画で集計・公表される。従って、分析用のデータを作りやすい。

 ここからは、具体的にデータを見ながら考えていこう。使用するデータは2019年の新宿区内の地価公示である。新宿区内の地価で最も高いのは、1平方メートル当たり3600万円の新宿区新宿3-24-1の地点。町字は新宿で、最寄り駅も新宿駅だ。では町名と駅のそれぞれの切り口で、地価が高いのか分析してみる。まず各地点の場所と、価格の分布を示すヒストグラム、新宿区の要約統計量を以下に示す。要約統計量とは、平均や分散、標準偏差などの分布を表す値のことである。

新宿区内の地価公示点の位置
新宿区内の地価公示点の位置
2019年の新宿区内の地価公示のあった地点をプロットした
新宿区全体の地価のヒストグラム
新宿区全体の地価のヒストグラム
地価公示の地点について価格がどう分布しているかヒストグラムで示した
新宿区全体の地価の要約統計量
新宿区全体の地価の要約統計量
地価公示の地点の地価について、平均や分散、標準偏差などの値を算出した。単位は円(Nと標準偏差を除く)
有料会員になると全記事をお読みいただけるのはもちろん
  • ①2000以上の先進事例を探せるデータベース
  • ②未来の出来事を把握し消費を予測「未来消費カレンダー」
  • ③日経トレンディ、日経デザイン最新号もデジタルで読める
  • ④スキルアップに役立つ最新動画セミナー
ほか、使えるサービスが盛りだくさんです。<有料会員の詳細はこちら>