Help us understand the problem. What is going on with this article?

PythonでWEBスクレイピング(個人メモ用)

Pythonを独学し始めて2日目の私が簡単なWEBスクレイピングに挑戦しました。
いくつかのサイトを参考にして作成しました。
個人的なメモ用として投稿します。
今回は
・title
・h2
2つの要素を抽出します。

準備

・requestsモジュールをインストール

コマンド
pip install requests

・Beautiful Soupモジュールをインストール

コマンド
pip install beautifulsoup4

プログラム

コード
import requests
from bs4 import BeautifulSoup

# 取得したいURL
url = "*********"

# urlを引数に指定して、HTTPリクエストを送信してHTMLを取得
response = requests.get(url)

# 文字コードを自動でエンコーディング
response.encoding = response.apparent_encoding

# HTML解析
bs = BeautifulSoup(response.text, 'html.parser')
# titleを抽出
title_tag = bs.find('title')
print(title_tag.text)
# h2要素を抽出
h2_tags = bs.select('h2')
for h2_tag in h2_tags:
    print(h2_tag.text)

参考サイト

いつも隣にITのお仕事

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away