More than 5 years have passed since last update.

Ruby でwebスクレイピング (未完)

Last updated at 2016-10-21Posted at 2016-10-21

あるwebサービスから情報を取る必要があったが、400件ほどありスクレイピングのほうが早いと思ったのでrubyでスクレイピングして情報を取ってきてcsvファイルで出力するアプリを作っていく。

mechanizeのインストール

ruby のgemなので

gem install mechanize

ここから実際にプログラムを書いていく。

こちらのページをスクレイピングしていきます。

tableにある文字列を取ってきます。

といっても簡単ですね

適当にrbファイルを作って
mechanizeをrequireします。

scraping.rb

require 'mechanize'

agent = Mechanize.new
page = agent.get("http://www.rakumachi.jp/info_seminar/")
elements = page.search('table')
elements.each do |element|
  puts element.inner_text
end

Mechanize.newでmechanizeのインスタンスを生成

page = agent.get("url")でurl先のhtml情報を取得しています。

searchメソッドは指定要素を取ってきています。

inner_text でタグの中身だけを取ってきます。

これを実行するとデータが取り出せました！

次はcsvファイルにまとめていきますが...

一旦休憩！

参考　http://qiita.com/shizuma/items/d04facaa732f606f00ff

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up