クローラー/スクレイピング Advent Calendar 2014, 12月13日担当記事です.
はじめに
お寿司を手頃な価格で美味しく食べたいです.
寿司アドベントカレンダー2013を眺めていると, 美登利寿司というお寿司屋さんが大変良さそうだと言う結論になりました. 一旦異論は認めません.
ただ, 美登利寿司は大変な行列のようで, 時間を間違えると824分待ちになるみたいです.
並ぶのは嫌ですから, 空いているタイミングを狙いたいです.
寿司屋待ち行列の長さを観測したい
美登利寿司は, 実際に並ぶのではなく, Web上で登録して並ぶ形式みたいです.
文章だとよく分かりませんね. こんな感じです.
順番受付を行って, 入店間際にアラートメールが来るシステムです. いい時代になりました.
...ここに, 全店の行列の長さ情報が乗っていますね.
今回はここのデータを利用します.
最も空いている店に最もすんなり入れる時間が知りたいので, このページをスクレイプして, 定期的に行列の長さ情報を取得してみました.
行列の長さ推移をグラフに
スクレイプに用いたコードとデータ, そして解析結果をgithubにアップしてあります.
wgetしてgrepしてsedするスクリプトを, 研究室のサーバーで回し続けてデータを取りました.
各店舗の行列の長さを20分おきに観測して, 得られた行列の長さ時系列データをグラフにしてみ
ました.
上から, 赤坂, 銀座, 吉祥寺, 渋谷, 玉川店の, 行列の長さ推移です.
平日と土日で色を分けています.
渋谷店はすぐにいっぱいになっています.
赤坂店が比較的空いているように見えます.
赤坂店に注目してみます. 1日の行列の長さ推移. 12月6日のグラフです.
15時くらいが空いていますね.
結果
12月13日に行ってきました.
行くぜ
— はたむ (@gg_hatano) 2014, 12月 13
いい寿司だった(1800円)
— はたむ (@gg_hatano) 2014, 12月 13
お金を気にせず食べて1800円でした.
まとめ
美登利寿司の行列の長さ推移データを作ってグラフにしてみました.
安くていい寿司でした. また行きます.
以上です.