はじめに
本記事では、requestsライブラリを使用してHTTPを処理します。
実装
example.py
import requests
url = 'http://www.webscrapingfordatascience.com/basichttp/'
r = requests.get(url)
print(r.text)
- 最初にrequestsモジュールをインポートする。
- 続いて、http://www.webscrapingfordatascience.com/basichttp/ のコンテンツの取得に取りかかる。このWebページにアクセスしてみると「Hello from the web!」という文字列がページに表示される。この文字列を、Pythonを使って抽出したい。
- この例では、
requests.get
メソッドを使用して、urlに対する「HTTP GET」リクエストを実行している。 -
requests.get
メソッドは、requests.ResponseというPythonオブジェクトを返す。このオブジェクトには、取得したHTTPレスポンスに関する多くの情報が格納されている。 - r.textにはHTTPレスポンスのコンテンツ本体がテキスト形式で格納される。
結果
Hello from the web!
何も問題がなければ、以下の行が表示されます。