0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Rubyでスクレイピング部

Last updated at Posted at 2025-07-08

?ムド??「今日の企画は何ぃ~?」コ??ット「Rubyでスクレイピングやってみた~」

先人のパクリです、やってることは
伏字の彼らと同じです、しょせんみんなHIKAKINのパクリなんだ

Rubyで始めるスクレイピング~入門編~

基本的には上記のサイトを参考にしたら無問題ラ!

上記サイトに書かれていなくて自分でまとめたいことだけまとめる

urlの開き方

先人サイトのコメント欄にも書かれていましたが、Rubyのバージョンの影響か

res = open(url)

これがエラーになります
なので下記のように記述しないといけません

res = URI.parse(url).open

パスの指定の仕方

5年前のQiitaのhtml要素の名前が結構変わっているので、パスの指定の仕方が参考にならなかったので

個人的に良かったのが
・検証用モードでウェブサイトを開く
・ほしい要素のところで右クリック
・Copy → Copy Selector でパスを拾ってくる
っていうのが簡単でよかったです。脳死でできるし。

stars = node.css('.style-1ydg2rj > :nth-child(1) > span')

こんな感じで親要素の下からそのまま不等号でつなげてやればおーけー(ネス風)

CSV出力の際の文字化け

これに関しては
・Excel のデータタブをクリック
・「外部データ取り込み」の「テキストファイル」を選択
・出力されたファイルを選択
・utf-8の設定がされていることを確認
で無問題ラ!

先輩に Ruby でスクレイピングする機会があるかどうか聞いたら、苦笑いされました!

...それって可能性はゼロじゃないってことだよな...?
対戦ありがとうございました。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?