はじめての投稿ですので、内容の薄いものと思われますがご容赦ください。
やったこと
・某飲食店レビューサイトのスクレイピング
・CSVファイルに取得項目を一覧保存
開発に至った経緯
私自身、エンジニアとして2年業務に携わってきて「そろそろ副業とかやりたいな」などふわっと考えておりました。そこで某スキルマーケットサイトや案件検索のサイトで案件を眺めていたところスクレイピングというものがあることを知りました。
それを見て、「これならできそうだし、記事にすればポートフォリオとしても使えるかも。。。」と考え、作成することを決めました。(なお、実務では開発しているものの、見せることのできるポートフォリオがないため発注には至りませんでした^^)
使用技術
・Python -v 3.12.6
・beautifulsoup4 -v
・requests -v 2.32.3
やってみて
結構簡単というか、かなり簡単でした。
スクレイピングにあたり、気をつけたのは下記のとおりです。
・対象サイトのrobots.txt(スクレイピングする際の規約のようなもの?)を確認すること
→こちらについては、スクレイピングを禁止しているエリアがある場合があるので確認しましょう。確認するには、ブラウザで「対象サイトのドメイン名/robots.txt」で確認できます。
・短時間でのスクレイピングは、サーバー負荷がかかるため最低でも1秒はあけること
→こちらについては参考にさせていただいたエンジニアインフルエンサー様が言っておりました。まあ、そりゃあそうという感じではあります笑
今後について
今回は思いつきでの記事作成ということもあり拙い文章+コードを記載していないというなんとも言えない記事になりました。今後は業務で触っているAWSやAzure、SnowflakeやC#やPython等々についても自分の成長記録として投稿していければと思います。
閲覧頂きありがとうございました🙇♂️