スケベサイエンティストで有名なDAIさん(noteはコチラ)の
12月8日24時まで無料公開中のチュートリアル(コチラ)をやってみました。
チュートリアルの内容
- ブログの記事名の取得
- そのブログのURLの取得
- 上記をCSVに出力してダウンロー
実行環境と使用するライブラリ
- 実行環境
- Google Colaboratory(環境構築不要のPythonの実行環境)
- ライブラリ
- Requests
- BuautifulSoup
- Pandas
感想
スクレイピングって思ってたより簡単!(ライブラリ様様)
今回のを応用して他にもできることがありそうなのでチャレンジしてみようかな。
主旨とは若干ずれるけど、解説がとっても丁寧ですごくわかりやすかった。
解説 → 練習問題 といった構成で少しずつレベルが上がり、
初心者には親切な作りでコンテンツの構成という部分も勉強になった。