スクレイピングに関して(基礎)
Q&A
Closed
###スクレイピングに関して質問です。
スクレイピングの際に、
Beautifulsoup4のライブラリーを使用するか、
それともJSONのライブラリーを使用するかイマイチわかりません。
上記2つの使用方法の違い等を簡単にご説明いただけると幸いです。
よろしくお願いいたします。
0 likes
Q&A
Closed
###スクレイピングに関して質問です。
スクレイピングの際に、
Beautifulsoup4のライブラリーを使用するか、
それともJSONのライブラリーを使用するかイマイチわかりません。
上記2つの使用方法の違い等を簡単にご説明いただけると幸いです。
よろしくお願いいたします。
BeautifulSoupという"ライブラリ名"とJSONという"規格名"を並べられても何を比較すればよいのかわかりません.そもそもBeautifulSoupはHTMLのパーサーなので,ユースケース自体根本的に異なるものです.
まずスクレイピングの流れを簡単にでも把握してから,もっと具体的に質問点をあぶりだしてください.
スクレイピングは、サイトの管理者に許可を得ているとか、規約に従って専用の API にアクセスしているとかでなければ、迷惑行為になるかもしれないということは認識してますか?
クローラーを作って某図書館サイトにアクセスしたら業務妨害とかで逮捕された事例もありますので、甘く見ない方がいいと思います。
逮捕までいかなくても、被害が深刻な場合は損害賠償の訴訟を受けるかもしれません。
訴訟までいかなくても、アクセス遮断ならWeb サーバーの設定で可能なので、多分に可能性はあると思います。帯域ごと遮断され、あなたのやったことで多数の利用者が巻き添えを喰らうことになるかもしれません。
回答するのは迷惑行為の手助けをすることになるかも。