スクレイピング設計指南書

Last updated at 2024-05-10Posted at 2024-04-25

初めに

こんにちは、株式会社ZEALの@sugayuuです。

大学院ではデータ分析を専門に研究を行っていました。ジールにエンジニアとして入社したからには、さらにスキルアップしたいと考え、データ抽出のスクレイピングについて学習を進めています。

いざ学習を初めてみて、データ抽出のコードの書き方や環境構築に対する情報はすぐに見つかりましたが、コードを書く上での前提知識についての記述が薄いと感じました。

そこで、今回はこれからWebスクレイピングを始めようと思っている人向けの有りそうで無かった指南書をまとめてみました。

	特徴	例
静的サイト	時間や検索条件などで情報の更新がないWebサイト	会社のホームページ
動的サイト	時間や検索条件などで情報が更新されるWebサイト	・気象情報の掲載Webサイト・ログインサイト

カテゴリーAのページタイトル	カテゴリーBのページタイトル
Aの名称	Bの題名