データソース: 総務省 家計調査(e-Stat API)2024年 品目別支出金額
対象: 47都道府県庁所在市 × 488品目(L5最細分類・二人以上世帯)
手法: 異カテゴリ間ピアソン相関 + BH-FDR多重検定補正 + 都市クラスタリング(k-means)
「POSデータがなくても、ここまで分かるのか?」
そう思ったのが、この分析の出発点だった。
前回記事:
【代替POSを発明!】政府統計だけでファミマの購買分析を再現してみたら、日本の食文化の“東西分断”が見えた
の分析で、政府統計だけでPOSデータを"代替"できることを示した。
牛肉×納豆の東西分断、カップ麺×炭酸飲料の寒冷地パターン。
76品目を全数探索して、10件の意外な相関を発見した。
そのあと気づいた。使ったのは全体の11%だった。
家計調査には488品目の最細分類がある。
前回は76品目を手動で選んでいたため、「ヨーグルトとせんべいが相関するかもしれない」とは最初から思いつかない。
全数探索をするには、全品目を自動で取得する必要があった。
11%から100%へ
| 前回 | 今回 | |
|---|---|---|
| 品目数 | 76品目(手動選択) | 488品目(全自動取得) |
| 探索ペア数 | 2,850通り | 118,828通り(42倍) |
| 多重検定補正 | なし | BH-FDR補正適用 |
| 有意な発見 | 139件(補正なし) | 87件(厳格補正済み) |
発見件数が減っているように見えるが、意味は逆だ。
118,828ペアを補正なしで検定すると偽陽性が約6,000件混入する。
BH-FDR補正で期待偽陽性率を1%以下に制御した結果が87件だ。
139件より87件の方が、ビジネスの根拠として使える。
今回の技術的なポイント(3点だけ)
① 全品目コードをAPIから自動取得
def fetch_all_item_codes(app_id):
data = requests.get('https://api.e-stat.go.jp/rest/3.0/app/json/getMetaInfo',
params={'appId': app_id, 'statsDataId': '0003348233', 'lang': 'J'}).json()
classes = data['GET_META_INFO']['METADATA_INF']['CLASS_INF']['CLASS_OBJ']
cat01 = next(o for o in classes if o['@id'] == 'cat01')
# L5(最細分類)のみ = 488品目
return {c['@code']: c['@name'] for c in cat01['CLASS'] if c.get('@level') == '5'}
② チェックポイント付きバッチ取得(途中でエラーになっても再開できる)
③ BH-FDR多重検定補正
from statsmodels.stats.multitest import multipletests
_, p_fdr, _, _ = multipletests(p_raw_values, method='fdr_bh', alpha=0.01)
この3点が前回との差分だ。本題に入る。
Part 1:118,828ペアから選んだ新発見 TOP5
1位. ヨーグルトをよく買う都市ほど、せんべいもよく買う(r=0.726)
| 指標 | 値 |
|---|---|
| ピアソン相関係数 | r = 0.726 |
| p値(FDR補正後) | 2.00×10⁻⁵ |
| スピアマン順位相関 | ρ = 0.713 |
| ヨーグルト TOP3 | 年間支出額 | せんべい TOP3 | 年間支出額 |
|---|---|---|---|
| 山形市 | 19,240円 | 山形市 | 10,609円 |
| 水戸市 | 17,462円 | 水戸市 | 9,571円 |
| 福島市 | 16,415円 | 福島市 | 9,172円 |
TOP3が山形・水戸・福島で完全に一致した。
ここで「なぜ?」を検証するため、2つの仮説を潰しにいった。
- 高齢化率仮説(「高齢者が多いから健康食品×伝統菓子?」)→ ヨーグルト×年齢中位数の相関は r=-0.19(有意でない)
- 所得仮説(「豊かだから?」)→ ヨーグルト×一人当たり所得は r=-0.07(ほぼゼロ)
年齢でも所得でも説明できなかった。残る仮説は「地理的食文化」だ。
山形・水戸・福島は、ともに畜産・酪農・米作が盛んな地域だ。
ヨーグルトは「地場の乳業メーカーからの地産地消的消費」、せんべいは「米どころの伝統菓子」として、同じ一次産業圏で需要が重なっている可能性がある。
スーパーでの買い物が中心で、コンビニへの依存度が相対的に低い地域でもある。
ファミマのPOSデータなら「この人にせんべいのクーポンを送れ」という個人レベルの推奨になる。
政府統計では「山形・水戸・福島の店舗ではヨーグルト棚の近くにせんべいを展開せよ」という地域MDになる。
2位. 都市ガスをよく使う都市ほど、ガソリンを使わない(r=-0.664)
| 都市ガス TOP3 | 年間支出額 | ガソリン TOP3 | 年間支出額 |
|---|---|---|---|
| 大阪市 | 75,240円 | 鳥取市 | 113,199円 |
| 名古屋市 | 73,117円 | 長野市 | 107,343円 |
| 京都市 | 68,413円 | 山口市 | 106,288円 |
都市ガスとガソリンは「都市インフラ利用者 vs 車社会」の逆指標だ。
都市ガスの引かれた集合住宅に住み電車通勤する人と、プロパンガスの一戸建てで車通勤する人は、消費構造が根本から違う。
「消費パターンが違う」とはこういうことだ ── ガソリン支出は鳥取市113,199円 vs 東京都区部10,213円で11倍の格差がある。
同じ「日本に住む二人以上世帯」が、都市型か地方型かで消費の骨格が入れ替わる。
3位. さんまをよく買う都市ほど、清酒もよく買う(r=0.660)
| さんま TOP3 | 年間支出額 | 清酒 TOP3 | 年間支出額 |
|---|---|---|---|
| 秋田市 | 1,043円 | 福島市 | 11,812円 |
| 山形市 | 968円 | 秋田市 | 8,918円 |
| 奈良市 | 908円 | さいたま市 | 8,673円 |
「東北の秋の食卓」がデータに刻まれている。
さんまの水揚げは東北・北海道が中心で、清酒は米どころ東北が主産地かつ主消費地だ。
奈良市がさんまの3位に入る理由は「さんまの姿寿司」という奈良の郷土料理にある。
データは文化を覚えていた。
4位. 納豆をよく買う都市ほど、みそもよく買う(r=0.658)
| 納豆 TOP3 | 年間支出額 | みそ TOP3 | 年間支出額 |
|---|---|---|---|
| 福島市 | 7,831円 | 秋田市 | 3,410円 |
| 秋田市 | 7,198円 | 長野市 | 3,390円 |
| 青森市 | 6,984円 | 山形市 | 3,051円 |
「1位: 牛肉×納豆」が東西分断を測る物差しなら、「4位: 納豆×みそ」は発酵食品文化圏を測っている。
納豆も味噌も大豆を発酵させた食品であり、東北・信州で重なって消費が高い。
同じ文化的背景を2品目が独立して捉えており、互いの相関が信頼性を補強し合っている。
5位. 豚肉をよく買う都市ほど、チーズもよく買う(r=0.665)
| 豚肉 TOP3 | 年間支出額 | チーズ TOP3 | 年間支出額 |
|---|---|---|---|
| 新潟市 | 38,810円 | 東京都区部 | 9,320円 |
| 横浜市 | 37,693円 | 横浜市 | 9,005円 |
| 岡山市 | 37,295円 | 仙台市 | 8,922円 |
関西が「牛肉文化圏」なのに対して、東日本は「豚肉文化圏」だ(牛肉×納豆の逆側)。
同じ東日本では洋食文化も浸透しているため、豚肉とチーズが同時に高い都市が揃う。
横浜が両品目でTOP3に入るのは「東日本都市型食文化」の象徴で、偶然ではない。
Part 2:元記事の発見は生き残ったか
| 発見 | 元記事(76品目・補正なし) | 今回(488品目・FDR補正) |
|---|---|---|
| 牛肉 × 納豆(東西分断) | r = -0.69 | r = -0.686 ✓ 再現 |
| カップ麺 × 炭酸飲料 | r = 0.71 | r = 0.707 ✓ 再現 |
| 喫茶代 × 鉄道運賃 | r = 0.73 | r = 0.730 ✓ 再現(1位) |
| ウイスキー × チーズ | r = 0.72 | FDR補正後に閾値外 △ |
3件は再現した。ウイスキー×チーズが落ちたのは、前回の補正なし分析で過検出されていた可能性が高い。
「補正で落ちた発見は使えない発見だった」 ということだ。
Part 3:日本の消費を7つに分類したら、1都市だけが孤立した
488品目 × 47都市をk-meansでクラスタリングすると、最適クラスタ数は7だった。
この図を見てほしい。47都市のうち、1点だけ明らかに外れている都市がある。
PC1は「都市型 vs 地方型」、PC2は「寒冷地 vs 温暖地」の軸と解釈できる。
右に行くほど電車・集合住宅・都市インフラ型、左に行くほど車・一戸建て・地方型。
上に行くほど灯油・保存食・防寒文化、下に行くほど外食・娯楽支出が多い。
左下に孤立しているのが那覇市だ。
| クラスタ | 都市 | 消費の特徴 |
|---|---|---|
| 東北北部型 | 山形・盛岡・秋田・青森 | 灯油・ストーブ・修繕費 |
| 地方中核型 | 福岡・広島・金沢など17市 | 制服・あじ・食器戸棚 |
| 個性的地方型 | 和歌山・松山・津・福井・長崎 | 婚礼・カステラ・輸送機器 |
| 関西型 | 京都・大阪・神戸・奈良・大津 | 私立小学校・鉄道定期代・腕時計 |
| 東日本地方型 | 仙台・前橋・宇都宮など10市 | 出産入院料・ゲーム機 |
| 首都圏+名古屋型 | 東京・横浜・さいたま・千葉・名古屋 | 私立中学校・カメラ |
| 沖縄型 | 那覇市(1都市のみ) | 婚礼3.3倍・粉ミルク2.8倍・鉄道定期代0.04倍 |
クラスタからはみ出た5都市:アルゴリズムが教えてくれた個性
散布図を見ると、クラスタの重心から大きく外れている都市が5つある。
それぞれに、データが語る「その都市らしさ」があった。
山形市(東北北部型の中で上方向に単独で飛び出す)
最大の特徴は中華そば:全国平均の2.4倍(22,389円)。
山形の冷やしラーメン・肉そば文化が年間支出データにそのまま刻まれている。
加えてこんにゃく(2.0倍)・さといも(2.7倍)・しょう油(1.8倍)と伝統的な和食材が揃う——東北の食文化そのものだ。
そして「なぜか腕時計が7.9倍」という謎については、後のコラムで深掘りする。
富山市(地方中核型の中で上方向に大きく逸脱)
突出しているのが室内装飾品:全国平均の6.8倍(13,421円)。
富山県は持ち家率・一世帯あたりの延床面積が全国トップクラスで、「広い家を丁寧に飾る」文化がデータに出ている。
住宅への誇りと投資意識が、インテリアへの支出として現れている。
食材では**いか(2.3倍)・ぶり(2.3倍)・こんぶ(2.2倍)・魚介の漬物(2.6倍)・かまぼこ(クラスタ内1位)**と、富山湾の幸が並ぶ。
こんぶが突出している背景には、北前船が運んだ昆布文化が今も根付いているという歴史がある。
「家は広く、食卓は豊か」——富山市の消費はこの二軸で語れる。
松山市(個性的地方型の中で左方向に単独で逸脱)
高校補習教育・予備校:全国平均の2.9倍(25,103円)が最大の特徴だ。
一方でスポーツ月謝は全国平均の0.3倍と突出して低い。
「習い事は削って受験に全振り」という優先順位が、支出データから読み取れる。
食材では柑きつ類:2.0倍。愛媛はみかんをはじめとする柑橘の一大産地で、地産地消が自然に消費に現れている。
「教育熱の高さ」と「地元の柑橘への愛着」という一見無関係な二つの特徴が、この都市の個性を作っている。
福岡市(地方中核型の中で下方向に大きく逸脱)
三本柱がある。
たらこ:全国平均の2.6倍(4,871円)——博多の明太子文化の原料品がそのまま数字になっている。
クラスタ内17都市と比べても圧倒的なz=3.42で、「たらこの消費が多い都市ランキング全国1位」が博多であることを家計調査が裏付ける。
外国パック旅行費:全国平均の4.1倍(34,491円)——韓国・中国・台湾が2〜3時間圏内というアジアゲートウェイの立地が消費に直結している。
福岡から海外旅行に行くコストは東京より圧倒的に安く、「ちょっと韓国」が日常的な選択肢になっている。
ネクタイ(3.2倍)・ゴルフ用具(3.2倍)・教育月謝(3.8倍)——九州最大のビジネス都市の顔。
「食は博多、旅はアジア、仕事はスーツとゴルフ」という都市の個性が、488品目から浮かび上がる。
さいたま市(首都圏+名古屋型の中で右端に飛び出す)
双璧をなすのが**畳替え:全国平均の10.5倍(4,821円)と楽器:全国平均の9.0倍(14,840円)**だ。
畳替えは持ち家・一戸建て率の高い郊外ファミリー層を示し、楽器はヤマハ・カワイ教室が集積する子育て文化を反映している。
幼児教育費:2.8倍も同クラスタ内でトップで、「広い家に住む子育て世代が教育と音楽に全力投資する」という郊外型ライフスタイルの典型だ。
対照的にガソリンは全国平均の0.5倍。
「電車で都心に通勤するため車への依存が低い」ことが、消費の全体像に一貫性を与えている。
なぜ那覇だけが孤立したのか
アルゴリズムが7クラスタに分けたとき、那覇市だけが1都市で1クラスタを占めた。
他の6クラスタには最低4都市が入っているのに、那覇だけは単独だ。
これは「どの都市とも束ねられない」という判断をアルゴリズムがくだした結果だ。
それは「所得」でも「人口」でも説明できない。
消費構造そのものが、本土とは別のロジックで動いている。
那覇市の特異性を数字で見ると:
- 婚礼関係費: 全国平均の3.3倍(13,950円 vs 全国4,273円)
- 粉ミルク: 全国平均の2.8倍(2,561円 vs 全国927円)
- たんす: 全国平均の7.8倍(2,513円 vs 全国322円)
- 鉄道通学定期代: 全国平均の0.04倍(83円 vs 全国2,078円)
- 外壁・塀等工事費: 0円(全国平均32,236円)
「婚礼と育児(若い人口・出生率の高さ)への支出が突出して高い」一方、
「鉄道がほぼない(モノレール1路線のみ)」「外壁工事がゼロ(台風対策は別の形で行われる)」。
本土の消費モデルとは根本から構造が違う。
那覇の消費は「若い・伝統的・車社会・鉄道なし」という組み合わせで、488品目すべてを使った距離計算でも他のどの都市とも一致しなかった。
コラム:なぜ山形は腕時計を買うのか
散布図で気になった方もいると思う。山形市の腕時計支出は 全国平均の7.9倍(18,031円) だ。
まず「豊かだから」という仮説を潰しにいった。他の高額品を見ると——
| 品目 | 山形市 | 全国平均 | 倍率 |
|---|---|---|---|
| 腕時計 | 18,031円 | 2,287円 | 7.9倍 |
| 海外パック旅行費 | 0円 | 8,492円 | 0倍 |
| カメラ・ビデオカメラ | 88円 | 640円 | 0.1倍 |
| ゴルフ用具 | 318円 | 941円 | 0.3倍 |
| テレビ | 951円 | 6,179円 | 0.2倍 |
高級品を全般的に買っているのではなく、腕時計だけが突出している。
これは「豊かさ」ではなく「産業」の痕跡だ。
山形市の通勤圏内・東根市には山形カシオ(カシオ計算機の子会社)が立地する。
G-SHOCKをはじめとするカシオ製時計の主力工場だ。
製造業の工場城下町では、従業員が自社製品を社員割引で購入し、その消費が地域全体に波及する。
「腕時計を作る街の人々が腕時計を買う」という産業と消費の循環がこの数字を作っている可能性が高い。
ここで面白い対比がある。腕時計の全国**1位は京都市(10.7倍・24,545円)**だ。
| 京都市(全国1位) | 山形市(全国2位) | |
|---|---|---|
| 倍率 | 10.7倍 | 7.9倍 |
| 推定背景 | 贈答文化(結婚・昇進の縁起物) | 産業文化(工場城下町効果) |
| 他の高額品 | 私立小学校・鉄道定期代も高い | 海外旅行0円・カメラ0.1倍 |
| 消費の性格 | 「ハレの日に贈るもの」 | 「身近にある産業の産物」 |
同じ「腕時計消費が多い」という結果でも、背景のロジックは180度違う。
政府統計は「何が売れているか」は捉えられるが、「なぜ売れているか」は捉えられない。
その「なぜ?」を考える余白こそが、この分析を面白くする。
地域MD戦略への示唆
この分析が示すのは「どこに何を置くか」だ。
東北北部(山形・秋田・青森)向け店舗
- ヨーグルト売場の近くにせんべいを配置する(r=0.726)
- さんまの旬期に清酒の棚を隣接させる(r=0.660)
- 灯油購入者に防寒・保温食品をレコメンドする
関西型(京都・大阪・神戸)向け店舗
- 牛肉売場の近くに料理酒・赤ワインを配置(牛肉との強相関)
- チーズとウイスキー(またはワイン)を同コーナーで展開
- 喫茶・カフェ系商品の充実(全国最高水準の喫茶代)
那覇向け店舗
- 婚礼・育児関連商材の充実(全国比3〜4倍の消費)
- 鉄道系サービスとの連携は不要(モノレール1路線のみ)
- 本土の「ベストプラクティス」をそのまま適用すると外れる
「都市型か地方型か」という粗い分類より、消費クラスタ別のMD戦略の方が精度が高い。
そしてそのクラスタは、無料の政府統計から導ける。
まとめ:11%から100%に拡張して見えたもの
- ヨーグルト×せんべいは「地場一次産業圏」の消費文化だった — 年齢でも所得でも説明できない
- 都市ガス×ガソリンは「都市度」の完璧な逆指標 — 11倍の格差がある
- さんま×清酒は文化の記憶 — データは食文化の季節性を覚えている
- 日本の消費は7クラスタ、那覇は完全孤立 — 488品目で初めて見えた構造
- FDR補正で139件→87件 — 数が減って信頼性が上がった
「仮説ではなく、構造が見えた。」
次は時系列(2007〜2024の17年分)で、相関構造が「いつ変わったか」 を追う。
コロナが消費を変えたのか、物価上昇が代替行動を生んだのか。
その話はまた別の記事で。
e-Stat Analysis Pipeline v2.0 | 統計表ID: 0003348233 | BH-FDR補正 | k-means(k=7)
