目的
スクレイピングの基本的なやり方を学ぶ
利用用途
- 試しにスクレイピングしてみたい場合
- beautiful soupを体験してみたい場合
準備するもの
- Google Colab(https://colab.research.google.com/)
- ※Googleアカウントが必要です
- アクセスするサイトのURL(※本記事は私のブログで実施しました。アクセス先の迷惑にならないように実施しましょう。)
コードの設計
- サイトにアクセスしてデータを取得する
- 整形する
- printで表示する
参考文献
ソースコード
test_scraping.py
from bs4 import BeautifulSoup
import requests
res = requests.get('https://www.ikuji-kaji-yaruman.work/')
soup = BeautifulSoup(res.text, 'html.parser')
for h2 in soup.find_all('h2'):
print(h2.text)
注意点
- ソースコード中にある私のサイトに繰り返しアタックしないようにお願いします笑
感想
- Colabを使うとpython環境の構築が不要なのでとても便利!