オープンデータって言って良いのかわからんが...(カテゴリ)
趣味でTrainLCDという位置情報と連動して電車のLCDを再現するアプリをAndroid/iOS/iPadOS向けに作ってるTinyKittenといいます。。
アプリのバックエンドとしては、鉄道の元データとして駅データ.jpというサイトからデータをダウンロードしたものをゴニョゴニョしてMySQLに保存してNestJSのAPIでJSONで返しています。
そこで、駅データ.jpを使って困ったところとかその解決方法を残していきたいと思います。
都道府県がたまに入ってない
例えば東京都豊島区のデータには住所のフィールドに東京都豊島区と入っているべきですが、唐突に豊島区と入っているときがあります(これは例で、実際豊島区のデータでそういうデータが入っているか執筆時に確認したわけではありません)
これは都道府県のIDが入っているのでPythonでちゃちゃっと都道府県が入っていないデータを洗い出してIDから取ってきた都道府県を付与するだけです。
路線・駅データのローマ字表記が不十分
例えば越谷レイクタウン駅のローマ字表記が「koshigayareikutaunn」的な感じに入ってます。
これは仕方ないので全部手作業で治してます。自動翻訳で回そうとも思ったのですが翻訳ではどうにもできず。(東武動物公園駅とか無理。Tobu Zoological Parkみたいになる)
令和の時代に一週間ほどかけて手作業でコツコツ治すのはなかなかつらい。
成田エクスプレスがソートしてもおかしな並びになる
これはもうデータを返さないようにしてるので実際の並びは覚えてないのですが、渋谷の隣に高尾とか来ちゃってた気がします。
これに関しては対応する気も起きなかったのでAPI側のSQLで返さないようにしました。
結果にN'EXが入らないようにした(コミット)
まとめ
だいたいこんな感じの苦労がありました。割と頑張って作ったので皆さん使ってください。お願いします。なんでもしますから。