住所正規化ツールを比較しました。
住所の正規化とは何、なぜ必要なのについては、書籍「ヤバい住所」にわかりやすくまとめられています。
別に本のまわしものではありませんが💦 Kindle unlimited なら無料、Kindleなら500円で購入出来(2025年1月現在)て、ページ数もそれほど多くないので、気になった方にはお勧めです。
ここでは「第3章 さまざまなヤバい住所」に挙げられた住所の正規化を複数のツールで行い、精度の比較を行いたいと思いたちました。
正規化が難しいとされる住所に対するいやがらせ実験なので、一般的なツールの性能比較ではないことにご注意ください。
比較するツール
比較対象は、以下の4つです。いずれも無料プランを利用しています。
1. Addressian
2. ExcelAPI
3. ChatGPT
4. AI JIMY Converter
1. 著者の高橋太郎さんは、住所正規化API Addressian の作者(と言ってよいのでしょうか)の方だそうですので、このツールだと恐らく問題なく正規化できると思い、その結果と以下のツールを比較します。
2. ExcelAPI は「ヤバい住所」でも紹介されていますが、Excelから簡単に呼び出せるツールです。今回は 住所の統一 を使いますが、他にも便利な機能がたくさん用意されています。
3. ChatGPT は書き方次第でどうとでもなりそうですが、今回はシンプルなプロンプトで試しました。「以下の住所を、番地などの半角アラビア数字化や、町、号のハイフン化など、いわゆる正規化を行って表示してください。」ChatGPTのみ、APIではなく画面からの問い合わせです。
4. AI JIMY Converter は、弊社の製品です。この記事がこの製品の宣伝になればよいのですが、忖度なしに試してみようと思います💦 利用する機能は住所の正規化 です。
比較実施日
2025年01月17日
(バージョン違いなどにより、正規化結果が異なる可能性があります)
元データについて
「ヤバい住所」に例として挙げられた住所から20例を正規化します。
書籍では恐らく実在するであろう番地等を記載されていましたが、特殊な場合(それ自体が特殊な意味を持つなど)を除いて一律に架空の数値にしています。具体的には、例えば1丁目2番3号の様に変更します。その結果実在する住所になる可能性もあるのですが、ご容赦を。
また、番地等を書き換えることにより実在しなくなった結果、正規化に失敗する可能性もあります。併せてご容赦の程。
比較結果
No. | 分類 | 変換元 | ①Addressian | ②ExcelAPI | 一致 | ③ChatGPT | 一致 | ④AI JIMY Converter | 一致 |
---|---|---|---|---|---|---|---|---|---|
1 | 北海道固有の号線 | 北海道旭川市西神楽4線22号11番2号 | 北海道旭川市西神楽四線22 11番2号 | 北海道旭川市西神楽四線22号11-2 | × | 北海道旭川市西神楽4線22号11番2号 | × | 北海道旭川市西神楽4線22号11-2 | × |
2 | 住所の途中で数字+号 | 愛知県豊川市御津町佐脇浜三号地1番2号 | 愛知県豊川市御津町佐脇浜三号地1-2 | 愛知県豊川市御津町佐脇浜三号地1-2 | 〇 | 愛知県豊川市御津町佐脇浜3号地1番2号 | × | 愛知県豊川市御津町佐脇浜三号地1-2 | 〇 |
3 | 〃 | 香川県高松市塩江町安原下第1号2 | 香川県高松市塩江町安原下第一号2 | 香川県高松市塩江町安原下第一号2 | 〇 | 香川県高松市塩江町安原下第1号2 | × | 香川県高松市塩江町安原下1-2 | × |
4 | 丁目のバリエーション | 岩手県花巻市南万丁目1-2 | 岩手県花巻市南万丁目1-2 | 岩手県花巻市南万丁目1-2 | 〇 | 岩手県花巻市南万丁目1-2 | 〇 | 岩手県花巻市南万丁目1-2 | 〇 |
5 | 〃 | 秋田県潟上市昭和八丁目中の堀 | 秋田県潟上市昭和8中の堀 | 秋田県潟上市昭和八丁目中の堀 | × | 秋田県潟上市昭和8丁目中の堀 | × | 秋田県潟上市昭和八丁目中の堀 | × |
6 | 〃 | 静岡県下田市四丁目1-2 | 静岡県下田市4-1-2 | 静岡県下田市四丁目1-2 | × | 静岡県下田市4丁目1-2 | × | 静岡県下田市四丁目1-2 | × |
7 | 〃 | 埼玉県上尾市壱丁目123 | 埼玉県上尾市壱丁目123 | 埼玉県上尾市大字壱丁目123 | × | 埼玉県上尾市壱丁目123 | 〇 | 埼玉県上尾市壱丁目123 | 〇 |
8 | 〃 | 奈良県御所市1番地の2 | 奈良県御所市1-2 | 奈良県御所市1-2 | 〇 | 奈良県御所市1番地の2 | × | 奈良県御所市1-2 | 〇 |
9 | 〃 | 大阪府堺市東区日置荘西町7丁1-1 | 大阪府堺市東区日置荘西町7-1-1 | 大阪府堺市東区日置荘西町七丁1-1 | × | 大阪府堺市東区日置荘西町7丁1-1 | × | 大阪府堺市東区日置荘西町7-1-1 | 〇 |
10 | 街区符号のバリエーション | 石川県金沢市大野町四丁目ワ12-3 | 石川県金沢市大野町4-ワ12-3 | 石川県金沢市大野町四丁目ワ12-3 | × | 石川県金沢市大野町4丁目ワ12-3 | × | 石川県金沢市大野町4-ワ12-3 | 〇 |
11 | 〃 | 埼玉県鴻巣市本町一丁目本一町 | 埼玉県鴻巣市本町1-本一町 | 埼玉県鴻巣市本町一丁目本一町 | × | 埼玉県鴻巣市本町1丁目本1町 | × | 埼玉県鴻巣市本町1-本1町 | × |
12 | 〃 | 大阪府大阪市中央区久太郎町四丁目渡邊1 | 大阪府大阪市中央区久太郎町4-渡辺-1 | 大阪府大阪市中央区久太郎町四丁目渡邊1 | × | 大阪府大阪市中央区久太郎町4丁目渡邊1 | × | 大阪府大阪市中央区久太郎町4-渡辺1 | × |
13 | 〃 | 大阪府大阪市西区千代崎三丁目南1ー2 | 大阪府大阪市西区千代崎3-南1-2 | 大阪府大阪市西区千代崎三丁目南1-2 | × | 大阪府大阪市西区千代崎3丁目南1-2 | × | 大阪府大阪市西区千代崎3-南1-2 | 〇 |
14 | 〃 | 宮崎県都城市姫城町6街区1号 | 宮崎県都城市姫城町6-1 | 宮崎県都城市姫城町6街区1号 | × | 宮崎県都城市姫城町6街区1号 | × | 宮崎県都城市姫城町6-1 | 〇 |
15 | 道路方式の住居表示 | 北海道浦河郡浦河町大通1丁目2-3 | 北海道浦河郡浦河町大通1-2-3 | 北海道浦河郡浦河町大通一丁目2-3 | × | 北海道浦河郡浦河町大通1丁目2-3 | × | 北海道浦河郡浦河町大通1-2-3 | 〇 |
16 | 〃 | 山形県東根市板垣中通り1 | 山形県東根市板垣中通り1 | 山形県東根市板垣中通り1 | 〇 | 山形県東根市板垣中通り1 | 〇 | 山形県東根市板垣中通り1 | 〇 |
17 | 切り分けの難しい地名 | 京都府京都市東山区大和町大路通四条下る大和町1 | 京都府京都市東山区大和町1 | 京都府京都市東山区大和町大路通四条下る大和町1 | × | 京都府京都市東山区大和町大路通四条下る大和町1 | × | 京都府京都市東山区大和大路通四条下る大和町1 | × |
18 | 〃 | 長野県長野市南長野県町 | 長野県長野市南長野県町 | 長野県長野市大字南長野県町 | × | 長野県長野市南長野県町 | 〇 | 長野県長野市南長野県町 | 〇 |
19 | 異体字等の混じった住所 | 福岡県粕屋郡粕屋町駕与丁1丁目2-3 | 福岡県糟屋郡粕屋町駕与丁1-2-3 | 福岡県粕屋郡粕屋町駕与丁1丁目2-3 | × | 福岡県粕屋郡粕屋町駕与丁1丁目2-3 | × | 福岡県糟屋郡粕屋町駕与丁1-2-3 | 〇 |
20 | 〃 | 熊本県芦北郡芦北町芦北1234 | 熊本県葦北郡芦北町芦北1234 | 熊本県芦北郡芦北町芦北1234 | × | 熊本県芦北郡芦北町芦北1234 | × | 熊本県葦北郡芦北町芦北1234 | 〇 |
考察
AddressianとAI JIMY Converterの一致度が20件中13と比較的高く、無事に? 自社製品の提灯記事になり何よりです💦 半分強で無事なのかどうかは何とも言えませんけれど。
尤も、AddressianやAI JIMY ConverterよりExcelAPIの正規化の方が妥当なのではないかと思われるものもありますし、(正しいかどうかというよりも)単にこの二つのツールの傾向が近いというだけの話かも知れません。
但し、異体字等の混じった住所(No.19 No.20)では、誤字を正しく変換したAddressianとAI JIMY Converterが一歩リードしているのではないかと思います。これも自画自賛ですが。
どのツールの結果も明確に間違いというものではほぼなく、常に同じツールを使って正規化すれば同じ結果になると思うので、使い勝手の良さや料金で比較してご利用を検討されたら良いのではないのかなと思います。
重ねて記載しますが、これは意地悪テストですので、利用される際は一般的なデータで試して評価してくださいね。
勿論、AI JIMY Converter を選んでいただけると私は嬉しいです。
参考
使い方や料金は、それぞれのページをご確認ください。
2025年1月時点で、どれも無料プラン的なものが用意されてます。
1. Addressian https://addressian.netlify.app/
2. ExcelAPI https://excelapi.org/
3. ChatGPT https://chatgpt.com/
4. AI JIMY Converter https://converter.aijimy.com/
おまけ
私もかつては、住所の正規化なんてexcelで2時間あれば作れそう と考えていました。実際にはルール化されておらず、奥の深い、というより底なし沼か蟻地獄の世界だなと。
技術が進化して、よくぞここまで来たものだ と感慨深いです。