※この記事はジョークです。(✿´ ꒳ ` )
情報取得元 (° ꈊ °)✧˖°オホッ!
- ブログ
- mixi
- その他SNS
いんたーねっと上にいっぱい情報転がってるよ₍₍ ( ๑॔˃̶◡ ˂̶๑॓)◞♡
Webスクレイピング (灬╹ω╹灬)┣¨キ┣¨キ*
- Jsoup
まずはブログの記事を根こそぎ抜き取るよˉ̞̭ ( ›◡ु‹ ) ˄̻ ̊
ツイートでもいいよ( ∩ˇωˇ∩)
【Webスクレイピング】
http://dev.classmethod.jp/study_meeting/web-scraping-tokyo-2nd/
【関連】
http://qiita.com/FScoward/items/ede5b4c0c98111c219bf
http://qiita.com/FScoward/items/01e3e3e0c213d322383f
日時の抽出 ╭( ・ㅂ・)و ̑̑ グッ !
やっぱり情報は鮮度が命だからね!'(<◉>◞౪◟<◉>)'
キーフレーズ抽出 (๑•﹏•)
- kuromoji
- LIBLINEAR
kuromojiで形態素解析してLIBLINEARでキーフレーズ抽出+。:.゚٩(๑>◡<๑)۶:.。+゚
近頃どんな記事を書いているのか、どんなツイートしてるかを分析しちゃうぞっ٩(๑❛ᴗ❛๑)۶ ヤッタ~!
相手の行動パターン、趣味、好きなものが読み取れるかも(๑╹ڡ╹๑)
【関連】
http://qiita.com/FScoward/items/78597e012ffe5c281cfc
BigQuery
データは全部BigQueryに突っ込んじゃえ!(ㆁᴗㆁ✿)
何かに使えるかも(´﹃`)
【関連】
http://qiita.com/FScoward/items/d10a69f3fa94e9620ae2
http://qiita.com/FScoward/items/326479ba990c7c6d805e
ぷらすあるふぁ (੭ ˃̣̣̥ ω˂̣̣̥)੭ु⁾⁾
毎日「仕事おわった」と律儀につぶやく人なら、勤務体系もバッチリまるわかり!(๑╹ڡ╹๑)
bye (⋈◍>◡<◍)。✧♡