?ムド??「今日の企画は何ぃ~?」コ??ット「Rubyでスクレイピングやってみた~」
先人のパクリです、やってることは
伏字の彼らと同じです、しょせんみんなHIKAKINのパクリなんだ
基本的には上記のサイトを参考にしたら無問題ラ!
上記サイトに書かれていなくて自分でまとめたいことだけまとめる
urlの開き方
先人サイトのコメント欄にも書かれていましたが、Rubyのバージョンの影響か
res = open(url)
これがエラーになります
なので下記のように記述しないといけません
res = URI.parse(url).open
パスの指定の仕方
5年前のQiitaのhtml要素の名前が結構変わっているので、パスの指定の仕方が参考にならなかったので
個人的に良かったのが
・検証用モードでウェブサイトを開く
・ほしい要素のところで右クリック
・Copy → Copy Selector でパスを拾ってくる
っていうのが簡単でよかったです。脳死でできるし。
stars = node.css('.style-1ydg2rj > :nth-child(1) > span')
こんな感じで親要素の下からそのまま不等号でつなげてやればおーけー(ネス風)
CSV出力の際の文字化け
これに関しては
・Excel のデータタブをクリック
・「外部データ取り込み」の「テキストファイル」を選択
・出力されたファイルを選択
・utf-8の設定がされていることを確認
で無問題ラ!
先輩に Ruby でスクレイピングする機会があるかどうか聞いたら、苦笑いされました!
...それって可能性はゼロじゃないってことだよな...?
対戦ありがとうございました。