シリーズ: 常識をデータでひっくり返す / 制度・地域行動編 【Part 1:観測編】
データ: e-Stat(衛生行政報告例・医療施設調査・国勢調査)+ 国土地理院 面積調
分析スタイル: Python(e-Stat API)自動取得 + AI(Claude)との壁打ち
はじめに:コンビニより多い接骨院、そして「大阪異常」
「接骨院、やたら多くない?」という感覚は正しい。全国の接骨院(柔道整復の施術所)は約5万施設で、コンビニ(約5.6万)に迫る水準だ。美容室にいたっては約27万で、コンビニの5倍ある。
そして、もっと面白いのがここだ。
| 接骨院(柔道整復 施術所・2020年) | 施設数 | 人口 |
|---|---|---|
| 大阪府 | 6,982 | 8,838,000 |
| 東京都 | 6,161 | 14,048,000 |
人口が1.6倍の東京を、大阪が絶対数で上回る。 人口10万人あたりにすると大阪79.0・東京43.9で、その差は約1.8倍になる。
「大阪人だから多い」「関西の文化だ」──そう片づけたくなる。だがこのPart1では、その“文化論”を一度すべて捨てて、引けるノイズ(人口密度・高齢化・所得)を全部引いたとき、本当に「説明できない差」が残るのかだけを確かめる。
クイックサマリー(Part 1)
3行で読む:
- 接骨院は全国約5万でコンビニ級。大阪は人口1.6倍の東京を絶対数で上回る
- だが人口密度との相関はほぼゼロ。高齢化・所得を引いた残差で見ると、「説明できない県」1位は大阪ではなく和歌山(+2.9σ)
- 「人が多いから多い」では説明できない。この地域差は人口ではなく“別の構造”に支配されているらしい──その正体はPart 2で
§1 罠:「人が多いほど店が多い」は、半分しか正しくない
素朴に考えると「人口が多い東京に店も多い」はずだ。そこで、横軸に人口密度(対数)、縦軸に人口10万人あたり店舗数をとった散布図を業種ごとに描いた。
📊 相関係数 r って何? ── 初めての方向け
r(相関係数) は2つの数値が同じ方向に動くかを −1〜+1 で表す指標。
| r の値 | 意味 |
|---|---|
| +1 に近い | 一方が増えると他方も増える(正の関係) |
| 0 に近い | ほぼ無関係 |
| −1 に近い | 一方が増えると他方は減る(逆の関係) |
目安は |r|>0.5 で「中程度以上」、|r|>0.7 で「かなり強い」。
| 業種 | 人口密度との相関 $r$ | 向き |
|---|---|---|
| 理容室 | −0.75 | 地方ほど多い |
| 美容室 | −0.73 | 地方ほど多い |
| 歯科医院 | +0.52 | 都市ほど多い |
| 鍼灸院 | +0.35 | ほぼ無関係〜弱い |
| 接骨院 | +0.32 | ほぼ無関係〜弱い |

図1: 人口密度(対数)と人口10万人あたり店舗数。 読者に見てほしいこと: 美容室・理容室は右下がり(地方ほど多い)、歯科は右上がり(都市ほど多い)。同じ「店舗数」でも向きが真逆。

図2: 美容室(右下がり)と歯科(右上がり)を1枚に重ねた図。 読者に見てほしいこと: 固定投資が小さい美容室は地方で乱立し、CT・滅菌設備など固定投資の大きい歯科は都市に集中する。
そして接骨院。相関はほぼゼロ($r=+0.32$)なのに、大阪だけが図の上に突き抜ける。人口最多の東京を、人口あたりでも絶対数でも上回る。

図3: 接骨院(柔道整復 施術所)の絶対数 上位10県。 読者に見てほしいこと: 大阪(赤)が東京(青)を絶対数で上回る。人口比ではなく総数での逆転は、明らかな異常値。
ここが罠だ。 「人口密度で説明できない」とわかった瞬間、多くの分析は「じゃあ文化だ」で終わる。だが、人口密度以外の客観要因(高齢化・所得)をまだ引いていない。“文化”と結論する前に、引けるノイズを全部引く。 それが次章だ。
§2 残差分析:「説明できない県ランキング」を作る
接骨院の利用は、人口密度だけでなく高齢化率(高齢者ほど整骨院に通う)や所得(自費か保険か)にも左右されるはずだ。そこで、この3つの客観要因で重回帰し、説明できる分を引いた残り(残差) を見る。
$$
\text{接骨院}_{10万人} = \beta_0 + \beta_1 \log(\text{人口密度}) + \beta_2 \text{高齢化率} + \beta_3 \text{県民所得} + \varepsilon
$$
📐 R² と「残差」って何?
R²(決定係数) は、モデルがデータの変動をどれだけ説明できたかを 0〜1 で表す。R²=0.17 なら「客観3要因で説明できるのは17%だけ」。
残差 は「実測値 − モデルの予測値」。残差がプラスに大きい=客観要因から期待される以上に多い=何か別の力が働いている、と読める。
本稿では残差を標準偏差で割った 標準化残差σ で県を比較する。|σ|≧2 はおおむね「統計的に異常な水準」。
結果、接骨院の $R^2$ はわずか 0.17。地域差の8割は、人口密度・高齢化・所得では説明できなかった。 その「説明できない残り」をランキングにしたのが次の図だ。

図9: 残差(実測 − モデル予測)のランキング。 読者に見てほしいこと: 上位は和歌山・大阪・富山・京都・石川。1位は大阪ではなく和歌山(+32.7)。一方、東京はマイナス(−8.5)で「人口密度から期待されるより少ない」。
| 順位 | 県 | 残差 | σ |
|---|---|---|---|
| 1 | 和歌山 | +32.7 | +2.88σ |
| 2 | 大阪 | +27.4 | +2.41σ |
| 3 | 富山 | +21.4 | +1.88σ |
| 4 | 京都 | +19.7 | +1.74σ |
| 5 | 石川 | +12.3 | +1.08σ |

図10: 横軸=モデル予測、縦軸=実測。点線(予測=実測)より上が「説明しきれない過剰」。 読者に見てほしいこと: 大阪・京都・奈良・和歌山が線の大きく上、東京は線の下。「人が多い=治療院が多い」では説明できない世界。
接骨院だけだと偶然かもしれない。だが鍼灸院・歯科でも同じ残差分析をすると、構造が見える。

図11: 接骨院・鍼灸院・歯科の標準化残差(県順=接骨院の残差順)。 読者に見てほしいこと: 接骨院と鍼灸院は上位の顔ぶれ(関西+北陸)が一致するのに、歯科は東京がトップ。「外れる県」が業種で入れ替わる。
そして、ここで奇妙なことに気づく。接骨院・鍼灸の $R^2$ は0.17〜0.19と低いのに、歯科は0.39。 同じ「医療系」なのに、人口密度・高齢化・所得での説明力が倍も違う。
では、この「説明できない差」は何なのか?
ここまでで分かったのは、こういうことだ。
- 大阪の接骨院の多さは、人口でも高齢化でも所得でも説明できない
- 本当に異常なのは大阪以上に和歌山であり、外れるのは関西+北陸に偏る
- そして「外れる県」は業種によって入れ替わり、業種ごとに $R^2$ がまるで違う
つまり──どうやらこの差は「人口」ではなく、別の構造に支配されているらしい。
その「別の構造」の正体を、8つの制度を横断して炙り出したのが続編だ。キーワードは 「制度の曖昧さ」。同じ全国一律のルールなのに、なぜ地域で使われ方が変わるのか。そこには、物質の硬度のように測れる“制度の性質”が隠れていた。
データソース(Part 1)
| データ | 出典(e-Stat 統計表ID/2020年) |
|---|---|
| 理容・美容所数 | 衛生行政報告例 0004027011
|
| 接骨院・鍼灸院(施術所) | 衛生行政報告例 0004026951
|
| 歯科診療所数 | 医療施設調査 0002013847
|
| 人口 | 人口推計 0003448232
|
| 高齢化率(年齢3区分) | 国勢調査 0003448299
|
| 1人当たり県民所得 | 社会・人口統計体系 0000010103(2014年度) |
| 都道府県面積 | 国土地理院 全国都道府県市区町村別面積調 |
※残差は共変動の分離であって因果の証明ではない。