More than 5 years have passed since last update.
http://manga-checker.herokuapp.com/
構成
scala
play 2.0
heroku
mysql on ec2
cron + phpでスクレイピング
ハマったところ
mysqlのtimestampがplayでパースできないことに気づけなかった。結局VARCHARに逃げたけど、こういうとき意地を張って時間を無駄にすることが多い。
課題
htmlの分析が大味すぎる
レスポンスが遅い
実は文字化けしてる(metaタグとか)
おもしろいWeb漫画あったらおしえてください
Why not register and get more from Qiita?
- We will deliver articles that match you
By following users and tags, you can catch up information on technical fields that you are interested in as a whole
- you can read useful information later efficiently
By "stocking" the articles you like, you can search right away
Sign upLogin