Help us understand the problem. What is going on with this article?

rails 発展その7 スクレイピング

More than 1 year has passed since last update.

スクレイピングとはwebページのHTMLから情報を抜き出す方法です。
データの集計にも役立ちます。

railsスクレイピングの基本

gemfile
  gem 'mechanize'
 # このgemでスクレイピングができるようになります。
ターミナル
  $ bundle install
   #忘れずに反映します。
controller
  # 上から順にスクレイピングの基本となるコード例一覧です。

   sample = Mechanize.new 
   # Mechanizeを使ってスクレイピングをするには、Mechanizeクラスのインスタンスを生成します。

   page = sample.get("http://~~(アドレス)") 
   # getメソッドでHTMLを取得

   ele = page.search('h2 a')
   # searchメソッドでh2とaの要素を検索

   puts ele.inner_text
   # inner_textメソッドで得られたHTML情報のテキストを取得する

   puts ele.get_attribute('href') 
   # get_attributeメソッドでhrefの取り出し
   # puts ele[:href]としても良い
savaniased
趣味で色々勉強と投稿をしています。 最近ではPythonを初めとした、AIやデータサイエンスを勉強しています。 ただ、著作権の関係もあり投稿できないのが悩みの種ですが。
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away