0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

最近やったスクレイピングでテックブログを書いてみる

Posted at

はじめての投稿ですので、内容の薄いものと思われますがご容赦ください。

やったこと

・某飲食店レビューサイトのスクレイピング
・CSVファイルに取得項目を一覧保存

開発に至った経緯

私自身、エンジニアとして2年業務に携わってきて「そろそろ副業とかやりたいな」などふわっと考えておりました。そこで某スキルマーケットサイトや案件検索のサイトで案件を眺めていたところスクレイピングというものがあることを知りました。
それを見て、「これならできそうだし、記事にすればポートフォリオとしても使えるかも。。。」と考え、作成することを決めました。(なお、実務では開発しているものの、見せることのできるポートフォリオがないため発注には至りませんでした^^)

使用技術

・Python -v 3.12.6
 ・beautifulsoup4 -v
 ・requests -v 2.32.3

やってみて

結構簡単というか、かなり簡単でした。
スクレイピングにあたり、気をつけたのは下記のとおりです。

・対象サイトのrobots.txt(スクレイピングする際の規約のようなもの?)を確認すること
 →こちらについては、スクレイピングを禁止しているエリアがある場合があるので確認しましょう。確認するには、ブラウザで「対象サイトのドメイン名/robots.txt」で確認できます。

・短時間でのスクレイピングは、サーバー負荷がかかるため最低でも1秒はあけること
  →こちらについては参考にさせていただいたエンジニアインフルエンサー様が言っておりました。まあ、そりゃあそうという感じではあります笑

今後について

今回は思いつきでの記事作成ということもあり拙い文章+コードを記載していないというなんとも言えない記事になりました。今後は業務で触っているAWSやAzure、SnowflakeやC#やPython等々についても自分の成長記録として投稿していければと思います。

閲覧頂きありがとうございました🙇‍♂️

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?