##苔のサイトでURLを取得する
取得します。nilいっぱいになった。
bryophytes.rb
require 'open-uri'
require 'nokogiri'
url = 'http://rbg-web2.rbge.org.uk/bbs/Activities/BBSFGspac.htm'
charset = nil
html = open(url) do |f|
charset = f.charset
f.read
end
doc = Nokogiri::HTML.parse(html, nil, charset)
#table内の「maintexttable」の中を取りに行ってほしい
doc.xpath('//td[@class="maintexttable"]').each do |node|
p node.css('a').url
end
##PDFダウンロードは別問題
現在、調査中。
wgetも使ってみたけど、サーバーがちがうせいかうまくダウンロードできなかったので、Rubyの力を借りに来た。
次回に続く