日本の住所を扱うときに注意すべき点や、そもそも住所の構造がどうなっているかといったよもやま話を集めてみました。
都道府県とは
日本の住所で一番最初に来るのは都道府県です。広域自治体と呼んだりもします。1都1道2府43県と社会科で暗記しましたが、なんで4種類もあるのでしょうか。
基本は県で、特に重要な地域を府としました。廃藩置県時には府と県のみで3府302県が出来ました。
その後、東京府と東京市が合併して東京都が生れました。都の誕生です。今のところ都は東京都だけですので首都の都とも言えるのですが、大阪都構想では大阪府と大阪市が合併して大阪都が誕生する見込みでしたから、必ずしも首都を指すとは言えません。都は府よりも更に重要な地域って感じでしょうか。
唯一の道である北海道は、函館県・札幌県・根室県の3県に分かれていたものが北海道庁と庁になり、その後北海道と道に変更されています。道はもともとは律令制の五畿八道の道ですので律令国の上位概念です。一方、今の道は律令国相当の県と同格ですから、階層がちょっとおかしくなってる感じがしますね。庁は現在は存在しませんが、都道府県と同格の自治体です。
都道府県の上位概念として地方があり、複数の都道府県をひとまとめにして取り扱うときに使われます。東北地方とか関東地方とかですね。地方は自治体ではありませんし、名称や区分が一定しているわけではありません。三重県は近畿地方なのか中部地方なのかとか、東海や北陸を地方として扱うかなどですね。地方が住所表記に使われることはありませんので、ここでは気にしないことにします。
市町村とは
都道府県の次にくるのが市町村です。区を足して市区町村ということもあります。基礎自治体と呼んだりもします。都道府県が長らく47個で変化が無いのに対し、市町村は変化が激しいです。2018年10月1日以降は1718市町村が存在します。
まず町と村があります。町は「ちょう」または「まち」と読んで、読み方が統一されていないのでちょっと不便です。人口が集中している地域を町、それ以外のまばらに人が住んでいる地域を村と呼んでいました。だいたい人口5000人を超えたら村は町になります。村も「むら」または「そん」と読み方は統一されていません。
都市化が進み、町のなかで更に人口の集中したものを市としました。おおむね人口5万人以上で市となります。更に人口の集中した市は人口20万人以上で中核市、人口50万人以上で政令指定都市になります。中核市や政令指定都市になっても名称は市のまま変わりません。
市町村にしても中核市、政令指定都市にしても人口は基準の一つであって、他にも基準はあります。また、基準を全て満たすからといって制度間を昇格するとは限りませんし、基準を満たさなくなっても降格するとも限りません。なお、市町村は同格とされていますので、昇格や降格と呼ぶのは正しくありません。でも感覚的には合ってると思います。
市町村の上位概念として郡と支庁があります。どちらも自治体としての機能は無く、市町村をとりまとめた地域の呼称として使われます。郡は慣習的に住所表記などに使われますが、支庁は使われません。市は郡に入ることはありませんが、支庁に入ることはあります。町村は基本的にいずれかの郡に属するのですが、東京都島しょ部では郡に属さない町村もあります。平成の大合併の結果、郡の中に町村が一つだけになったり、全てが市になっで消滅した郡もあります。
区とは
市町村と同列に扱われることもある区ですが、長くなるので節を分けます。そもそも同じ区と呼ばれていても、機能的に全く違うものが混じっています。
まずあるのは都の特別区。現在は東京都に23区存在します。市町村とほぼ同等の機能権限を持つことから、市町村に加えて市区町村と呼ばれることもあります。
次にあるのが政令指定都市にある行政区。例えば神奈川県横浜市には18の行政区があります。行政区に更に権限を委譲した総合区という制度もあるのですが、現在のところ採用した政令制定都市はありません。
市町村には地域自治区が設置されることがあります。政令指定都市内の全ての地域がいずれかの行政区に属するのに対して、市町村内の一部にのみ地域自治区が設置されることもあります。平成の大合併時には合併特例区というのもあったのですが、現在は全て解消しています。地域自治区と合併特例区は必ずしも区とされるとは限らず、町や村とされる場合もあります。
更にややこしいのは兵庫県姫路市です。飾磨区・広畑区・大津区・勝原区・網干区・余部区の6区がありますが、姫路市は政令指定都市ではないので行政区ではありませんし、これらは地域自治区でもありません。しかし住所表記には使われていますので「〇〇区△△町」というちょっと長い町名であると解釈されています。
町・字とは
町・字は市区町村に存在する行政区画です。区画ですので自治体としての機能は持っていません。自治会や町内会が設置されていたとしても、それはあくまでも住民組織であって自治体ではありません。
町・字は町または字です。この町は市区町村の町とは別ですので、原理的には〇〇町△△町という地名が存在し得ますが、実在するかどうかは調べきれていません。また、村とつく場合もあります。〇〇市△△村などは存在します。
町は主に市街地で、字は農村部で用いられることが多いですが、そうと決まっているわけではありません。町は〇〇町となりますが、〇〇と町が付かない名称もあります。字は小字と区別する為に大字〇〇となりますが、大字を省略して〇〇とだけ呼ばれることもあります。
小字・丁目とは
町字は自治体ではありませんが、地域共同体ではあります。その町字を細分化して丁目や小字があります。町には丁目が、大字には小字があることが多いですが、例外もあります。丁目は数字が付いて一丁目(1丁目)、二丁目(2丁目)となります。漢数字またはアラビア数字が用いられますが、同じものを指します。丁目を省略して単に数字だけで表記することもあります。小字は地域名がついて字〇〇となります。
番・番地・号とは
小字・丁目の更に下に地番があります。地番は区画された土地に対して振られた番号で、土地の登記も地番で行われています。しかし地番は分筆・合筆を繰り返した結果複雑になってしまったために、新たに住居表示が導入されました。といっても全国一律に導入されたわけではなく、主に都市部での導入です。ですので住居表示が行われている地域と、地番が使用されている地域の両方があります。住居表示はあくまでも地番とは別に導入されたものですので、住居表示が導入されている地域でも土地の登記は地番で行われます。
地番を用いた場合は1丁目2番地3といった表記となり、住居表示の場合は1丁目2番3号となります。どちらも1-2-3と省略表示されることもあります。地番では1丁目2番地の3と「の」を間に入れる表記もあります。番地のあとの数字は枝番と呼びます。住居表示の〇番を街区符号、〇号を住居番号と呼びます。街区符号は通常は数字ですが、まれに数字でない場合もあります。
住所の分解の仕方
住所がひとかたまりの文字列として与えられて、それを階層別に分解したいことがあります。
単純に考えると /^(.*[都道府県])(.*[市区町村])/
という正規表現で都道府県と市区町村が取り出せそうです。しかし、この正規表現に「東京都府中市」を与えると「東京都府」という府と「中市」という市になってしまいます。
では最短一致にすればいいだろうと /^(.*?[都道府県])(.*?[市区町村])/
という正規表現を考えますが、今度は「京都府左京区」に対して「京都」という都と「府左京区」という区を取り出してしまいます。
世の中には「三重県四日市市」や「大阪府交野市私市」のように正規表現による切り出しが難しい地名がたくさんあります。うまく切り出せない地名に個々に対処した複雑な正規表現を組み立てる方法もありますが、市町村合併で新しい地名が登場したらに正規表現を修正しなければなりません。/(北海道|青森県|...|沖縄県)/(札幌市|...|那覇市)/
と住所マスターデータから全ての都道府県と市区町村名を列挙した正規表現を作る愚直な方法が一番かなと思います。
住所の表記揺れ
住所を自由記入した場合、非常に多くの表記揺れがあり得ます。ただ文字列として保持していればいいのならそのままですが、データとして扱うには正規化しておく必要があります。主な正規化ルールを挙げておきます。
都道府県、市区町村の省略
著名な市区町村であったり、同一県内同一市内の場合、都道府県や市区町村が省略されることがあります。新宿区でいきなり始まっても東京都の他に新宿区はありませんので特定は可能です。郵便等の宛名を「県内」や「市内」から始まって書くこともありますので、取り扱い地の住所から補完する必要があります。
郡の有無
町村の上位概念である郡は住所には表記されますが、されない場合もあります。どっちも対応しておく必要があります。
大字、小字表記の省略
大字と小字の節でも書きましたが、これらは省略されることもあります。「大字〇〇」は「〇〇」に、「字△△」は「△△」に省略され得ます。ただし大字と小字の区切りが分からなくなるため、「大字〇〇字△△」を「〇〇△△」とはしないようです。
小字の省略
大字単位で地番を振っている場合、小字を省略しても住所は特定可能なため省略されることがあります。
ノ、ツ、ケなど
霞が関や虎ノ門など、文字をつなぐ仮名文字が入る地名があります。その際に平仮名なのかカタカナなのか、小書きなのかそうでないかは正式な地名では決まっていますが、人によって使い方はバラバラです。東京都足立区竹の塚の地名は「の」ですが駅名は「竹ノ塚駅」と「ノ」ですし、東京都新宿区四谷の地名は「ツ」が入らないのに駅名では「四ツ谷駅」ですので、一概に入力した人の無知を責めるわけにもいきません。
漢数字とアラビア数字
番、番地、枝番、号の数字は漢数字またはアラビア数字で表記され得ます。また漢数字の場合でも百二十三と書く場合と一二三と書く場合があります。なお、アラビア数字表記され得るのは番・番地・枝番・号だけで、町・字より上の階層では使われません。東京都新宿区百人町を100人町と表記することはありません。
番地・番・号
正式な住所表記は1丁目2番地3や1丁目2番3号ですが、これを1-2-3と省略表記することもあります。省略された表記だけから番地なのか番なのかを推測することは不可能です。その情報が必要なら全国の地番と住所表記のデータベースを持っておかなければなりません。
番地と番のどちらが使われるかはそれぞれ決まっていますが、混同して入力されることはあります。「番地の」の「の」が入る入らないもそれぞれあり得ます。
漢字違い
茨城県龍ケ崎市は「ケ」の表記も揺れますが、「龍」が「竜」と揺れることがあります。宮城県塩竈市も「塩釜」と表記されることがあります。
その他のよもやま話
無番地
土地を管理する地番は最初は私有地に対して振られました。そのため明治以来ずっと国有地であった地域には地番が無いことがあります。映画のタイトルにもなった網走番外地などはこの例ですね。
また、河川や湖沼や海は土地ではありませんから地番もありません。埋め立てて土地になれば地番を振るわけですが、河川は自治体の境界になっていることもあります。その場合、埋め立てた土地がどちらの自治体に属するかを決めなければなりませんが、話し合いがつかず未だに決まっていないケースがあります。東京都の中央区と千代田区の境界にある銀座インズなどはこのケースです。
埋め立て地でなければ必ず地番や境界が定まっているかというと、そうとも限りません。富士山頂など、いかにも決めるのが難しそうなところは未だに定まっていません。
同名の市
同名の区町村は全国にたくさんありますが、市が同名なケースもあります。府中市は東京都と広島県に、伊達市は北海道と福島県にあります。市区町村名だけでは住所は特定できず、都道府県名が必須です。
同名の町村
かつて群馬県には東村が5つありました。群馬県東村ではどの東村か特定できませんから、必ず郡名を間に入れなければいけませんでした。現在は全ての東村が別の市町村となったため、群馬県東村で特定できない問題は解消しています。
同じ県内に同名の市町村がある例は他にはありませんが、北海道釧路市と北海道釧路町、広島県府中市と広島県府中町など市町村種別違いで同名というケースはあります。なお、別の都道府県に同名の町村というのは松前町(北海道と愛媛県)などたくさんあります。
(2023/7/26追記)
同名の市区町村について調べてみました。
(2023/7/26追記終わり)
街区方式と道路方式
住居表示には街区方式と道路方式の2種類があります。
街区方式は道路や河川に囲まれた区画を住所の単位として、その区画の中の建物に番号を振っていく方式です。日本では圧倒的に街区方式が多いです。
道路方式は道路を基準にして、その道路に面している建物に番号を振っていく方式です。欧米では道路方式が主流です。日本でも山形県東根市の一部などで採用されています。
日本郵政による住所
日本の住所のマスターデータとして日本郵便株式会社による郵便番号データが使われることがあります。大抵の場合は問題ないのですが、一部気を付けないといけない場合があります。郵便番号データはあくまでも郵便配達の為に作られていることに起因します。
一つは、複数の丁目が一つの郵便番号にまとめられている場合です。個別に郵便番号が振られていない市町村内の残りの地域が全て一つにまとめられたりもします。郵便番号だけを元にすると、これらの地域を区別することが出来なくなります。
もう一つは逆に細分化されている場合。大きなビルの階ごとや、大きな事業所ごとに郵便番号が別に振られている場合です。地番は土地に対して、住居表示は建物に対して行われますが、郵便番号は個別の宛先に対して振られているわけですね。
京都市の住所
京都市の中心部分では通り名を使った住所表記があります。例えば京都市役所の住所は「京都市中京区寺町通御池上る上本能寺前町488」です。通り名は、寺町通に面していて、御池通から北に上がったところにあるという意味です。通り名は一種の座標表記であって、町字の町ではありません。「上本能寺前町」が町なのですが、通り名だけで住所を特定可能なので町は省略されることもあります。
北海道の住所
北海道でも京都市とはまた違った通り名を使った住所表記があります。札幌市役所の住所は「札幌市中央区北1条西2丁目」です。これも座標表記なのですが、「北1条西2丁目」が町字に相当します。
町・字無し
茨城県龍ケ崎市役所の住所は「龍ケ崎市3710番地」と町・字がありません。これは省略しているのではなく、本当に町・字が無いのです。全国にはこういった住所がいくつかあります。龍ケ崎市の場合は小字はあるのですが番地だけで住所を特定可能なために省略されています。
(ここから2023/7/21追記)
志布志
住所のよもやまネタでよく出てくる志布志。「志布志市志布志町志布志の志布志市役所志布志支所」は「志」がひたすら出てくるのでゲシュタルト崩壊を起こしそうですね。ただ、住所の表記パターンとしては単純なので、システムで取り扱う際には問題にはならないと思います。
参考 : 志布志市志布志町志布志の志布志市役所志布志支所が志にあふれすぎている
街区符号がアルファベット
大阪府大阪市中央区上町には街区符号がA/B/Cという住所があります。「大阪府大阪市中央区上町A」などです。他に街区符号にアルファベットが採用されている地域は無いそうです。
金沢市利屋町
石川県金沢市利屋町には「い」「お」「ヲ」「カ」「ソ」「タ」「ち」「と」「ニ」「に」「ヌ」「子」「は」「ハ」「へ」「ホ」「ム」「ヨ」「り」「ル」「る」「レ」「ろ」「ロ」「ワ」「和」があります。
ひらがな、カタカナ、漢字があるのも大変ですが、「お」と「ヲ」、「は」と「ハ」、「る」と「ル」、「わ」と「和」は同音ですから区別するのが大変ですね。
引き続き厄介な住所の例を粛々と集めてるのだけど、
— inuro (@inuro) June 23, 2023
・金沢市利屋町は
・金沢市利屋町ハ
が別の区域だということを知ってさすがに頭を抱えている。#ヤバい日本の住所https://t.co/4NhLsCFoVg pic.twitter.com/XgylzAsubM
丁目ではなく丁
大阪府堺市では丁目ではなく丁が使われます。「大阪府堺市堺区市之町東1丁」などです。
なぜ丁が使われるかは歴史的な経緯があるそうで、丁目に変えようかという話が出たこともあるそうですが実現しなかったそうです。
(ここから2023/7/22追記)
新潟県新潟市北区東栄町
なんと漢字表記は全く同じなのに、「とうえいちょう」「ひがしさかえまち」と読み方が違う地名が存在すると。漢字表記のみでデータベース作ってると区別の付けようがないですね。困ったな。
参考 : 『新潟市北区東栄町』は2つある?!新潟に点在する「同じ地名だけど違う場所」調べてみた。
参考記事によれば、その他にも新潟県新潟市内には以下のような間違いやすい地名があるそうです。
- 秋葉区秋葉(あきは)と東区秋葉(あきば)
- 東区松浜町と北区松浜町
- 西区大野と西区大野町
- 亀貝IC(新潟市西区)と亀貝IC(長岡市)
市区町村違いの同名町・字は全国にたくさんありますが、同一市内にあるとややこしいですね。そして同じ西区内に大野と大野町があるのはかなりややこしそう。
郡なし
住所表記時には省略されることもありますが、町村は郡に属しています。東京都西多摩郡奥多摩町などですね。
ただし例外として東京都の島しょ部では郡が存在しません。大島町、利島村、新島村、神津島村、三宅村、御蔵島村、八丈町、青ヶ島村、小笠原村がそうです。これらの地域では、東京都三宅島三宅村と島名を付けて住所を示すこともあるそうです。
町・字・町域の不一致
京都府福知山市で一つの土地に二つの住所があるそうです。詳細はこちらの記事に書きました。
(ここから2024/10/13追記)
正規化のしくにい、変わった住所を集めている記事がありましたのでリンクしておきます。