この記事について
箇条書きにすると、個人的やりたい事に以下の2点がありました。
ったのですが以下のモチベーションで本件に取り組みました。
-
Geolonia 住所データ というものが公開されたので、これを使って何かしてみたかった
-そんな時に不審者情報サイトを見つけたので、これしかない!と即決 - selenium を使ったスクレイピングをしてみたかった
- beautifulsoupしか利用経験がなかったのです
成果物
このようなマップができました。
https://suzukidaisuke.gitlab.io/fushinsha_map/
※ 2020/8/27 全国版にしました
そのため重くなってしまった。地方はクマとか動物情報が多い。
大島てるの不審者情報バージョンみたいなものですね。
比べちゃ失礼なほど完成度低いけど。
また、gitlab pages というものを初めて使いました。こんな機能が有ったんですね。
どうやって作ったか
コードを gitlab にアップしたので、これを読めばわかります。
https://gitlab.com/suzukidaisuke/fushinsha_map
一応書くと
-
日本不審者情報センターから 2020年8月
東京都の不審者情報をスクレイピング - 基本的に以下のようなタイトルになっているので、正規表現で住所部分を取得。
(東京)西東京市田無町3丁目で公然わいせつ 8月24日昼過ぎ
- 取得した住所と Geolonia 住所データを結合して、緯度経度を得る
- folium ライブラリを使って、地図上に不審者情報をマッピング
感想など
- サクッとつくった割にはいい感じのものができたように思う。
- git の notebook みればサクッと加減がわかると思います。
- もっと作り込むこと(全国版にするとか、サーバ立てるとか)も出来そう
- だけど一旦ここでお終いの予定
- 住所が「○○丁目」まであれば簡単にこの位のものは作れる。
- selenium は簡単・便利。でも beautifulsoup のほうが早いかな?
- 気づかずサイズが大きいファイルを git にアップしてしまった。こういうの使えばいいのかしら。
https://docs.gitlab.com/ee/topics/git/lfs/
最後に
不審者には気をつけましょう。