BeautifulSoupの準備はこちら
最近モチベーション上がらなくて、上げるためにとりあえず書くことにしました。
本当に基礎の基礎なので悪しからず
とりあえず、BeautifulSoupを実行してみます。
from urllib.request import urlopen
from bs4 import BeautifulSoup
# 取得するページ
html = urlopen('http://www.pythonscraping.com/pages/page1.html')
bs = BeautifulSoup(html.read(), 'html.parser')
# h1タグを返す
print(bs.h1)
2行目の
from bs4 import BeautifulSoup
部分でBeautifulSoupをインポートする。
実行結果は下記となる。
http://www.pythonscraping.com/pages/page1.html
上記ページのh1タグだけ取得できることがわかる。
次回はちゃんとした内容で投稿します。
#参考文献
PythonによるWebスクレイピング(オライリー・ジャパン)