1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Scrapyとは?Python、webスクレイピング

Last updated at Posted at 2023-01-31

はじめに

備忘録です。

Scrapyとは?

フレームワークのこと。
webスクレイピングやクローリングするときに使われる。
Beautiful Soupとかを使い慣れた次に勉強するといいと思う。

公式ドキュメントによれば次の通り Google翻訳を使用した

Scrapy は、高速で高レベルの Web クロールおよび Web スクレイピング フレームワークであり、Web サイトをクロールし、そのページから構造化データを抽出するために使用されます。データマイニングからモニタリング、自動テストまで幅広い用途に使用できます。

具体的なメリットは?

  • 同じような処理を書かなくて済む
    • スクレイピングをしていたら同じような処理を何度も書くことがあると思う
    • ウェブサイトごとの違いに専念して書くことが出来る
  • robots.txtとかを考慮してくれる
    • robots.txtとは、スクレイピングされるサイトからのお願い
    • これはしてもいいよとかこれはだめだよって書いている
  • ほかにもいっぱいあるらしい
    • 勉強していきます(__)

参考文献

https://docs.scrapy.org/en/latest/

1
2
2

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?