##日本の住所システムは例外が多い
住所に絡む仕事をしていると本当に京都が嫌いになりますw
単に「住所かどうか」判定したいだけなのに、なんて「南入」「下る」という文字がはいるのか? いやいや下るなよ とおもわず突っ込んでしまいますがそんなことを入って、いや言っていられません。
ただ、それをアメリカ人に仕様書として送ることを考えると黄昏てしまうので、「きっとだれかが作ってるはず」とおもってググりました。
##やはりあった
ググるとやはりありました「HTML内の住所を探し出してゴニョゴニョしてみる」という岩本さんという方のブログの中に
http://tech.aainc.co.jp/archives/643
住所の正規表現
^((北海道|東京都|(大阪|京都)府|(神奈川|和歌山|鹿児島)県|[^\s\w\d ]{2}県)[^\s\w\d ]{1,6}[市郡区町村][^\s\w\d ]{1,20}[\d0-9〇一-九十上下東西]+[^\s '”<)」】]*)|^((北海道|東京都|(大阪|京都)府|(神奈川|和歌山|鹿児島)県|[^\s\w\d ]{2}県)[^\s\w\d ]{1,6}[市郡区町村][^\s\w\d ]{1,20})
ああ、ありがたい。十分です。コピペプログラマと呼ばれてもいい。
めんどくさいのはいやですw