「require 使いたいライブラリのファイル名」
大抵のプログラミング言語では、別々のファイルに分割されたプログラムを組み合わせて、一つのプログラムとして利用する機能を持っています。
他のプログラムから読み込んで利用するプログラムを「ライブラリ」と言います。
このライブラリを読み込むには、requireメソッドを使用します。
open文 URLにアクセスし、 URLを開く
charsetメソッド 対象サイトの文字種別(utf-8)を取得
readメソッド 対象サイトのhtmlを読み込む(open文によってURLを開き、htmlを読み込む)
doc = Nokogiri::HTML.parse(html, nil, charset)
は基本的に謎。
p doc.titleでtitle取得
スクレイピングを用いて理解する。(ここが理解できればサイト完成に近づく!)
# URLにアクセスする為のライブラリを読み込む
require 'open-uri'
#Nokogiriライブラリを読み込む
require 'nokogiri'
#スクレイピング先のURL
url = 'http://www.yahoo.co.jp/'
charset = nil #変数charsetにnilを代入=初期化かな
html = open(url) do |f| #変数htmlにopen文を代入し、URLにアクセスし、そのURLを開く
charset = f.charset # 文字種別を取得
f.read #htmlを読み込み、変数htmlに渡すメソッド
end
doc = Nokogiri::HTML.parse(html, nil, charset)
p doc.title