Qiita Conference 2025

Qiita史上最多!豪華12名のゲストが登壇

特別講演ゲスト(敬称略)

ymrl、成瀬允宣、鹿野壮、伊藤淳一、uhyo、徳丸浩、ミノ駆動、みのるん、桜庭洋之、tenntenn、けんちょん、こにふぁー

1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Scrapyとは?Python、webスクレイピング

Last updated at Posted at 2023-01-31

はじめに

備忘録です。

Scrapyとは?

フレームワークのこと。
webスクレイピングやクローリングするときに使われる。
Beautiful Soupとかを使い慣れた次に勉強するといいと思う。

公式ドキュメントによれば次の通り Google翻訳を使用した

Scrapy は、高速で高レベルの Web クロールおよび Web スクレイピング フレームワークであり、Web サイトをクロールし、そのページから構造化データを抽出するために使用されます。データマイニングからモニタリング、自動テストまで幅広い用途に使用できます。

具体的なメリットは?

  • 同じような処理を書かなくて済む
    • スクレイピングをしていたら同じような処理を何度も書くことがあると思う
    • ウェブサイトごとの違いに専念して書くことが出来る
  • robots.txtとかを考慮してくれる
    • robots.txtとは、スクレイピングされるサイトからのお願い
    • これはしてもいいよとかこれはだめだよって書いている
  • ほかにもいっぱいあるらしい
    • 勉強していきます(__)

参考文献

https://docs.scrapy.org/en/latest/

1
2
2

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up

Qiita Conference 2025 will be held!: 4/23(wed) - 4/25(Fri)

Qiita Conference is the largest tech conference in Qiita!

Keynote Speaker

ymrl、Masanobu Naruse, Takeshi Kano, Junichi Ito, uhyo, Hiroshi Tokumaru, MinoDriven, Minorun, Hiroyuki Sakuraba, tenntenn, drken, konifar

View event details
1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?