LoginSignup
1469

More than 3 years have passed since last update.

Webスクレイピングの注意事項一覧

Last updated at Posted at 2014-07-27

[2020/09/09追記]
本記事の内容は著作権法改正より前に記載されたものです。
最新の情報をご確認下さい。
* 著作権法の一部を改正する法律(平成30年法律第30号)について | 文化庁
* 令和2年通常国会 著作権法改正について | 文化庁

上記に関連して、次の記事を記載致しました。
* 【2020年度版】個人用クローラーの開発手順とその注意点 - Qiita


はじめに

Webスクレイピングで誰も嫌な思いをしなくて済むように、注意事項一覧を作りました。
ただ、法律の専門家による解釈ではないので責任は取れません。
この記事は、クリエイティブ・コモンズのCC-BYで公開致しますので、ご自由にご改修下さい。

注意事項一覧

データをダウンロードする時

目的は下記のものに限る。

 * 個人や家族間で使用する
 * Web検索サービスを提供する
 * 情報解析をする
 ※参考:著作権法第30条・著作権法第47条(6,7)

対象コンテンツは下記のものに限る。

 * 文章(データベースのコンテンツの場合はコンテンツの一部のみに留めておく)
 * 画像(同上)
 * 音声(パブリックドメイン等のオープンなライセンスの物に限る)
 * 映像(同上)
 ※参考:著作権法第30条・著作権法第47条(7)

Webサイトへアクセスする時は下記の制限を守る。

 * robots.txt/robotsメタタグのアクセス制限内容を守る。
 * robots.txtがない場合でも、サーバアクセスの間隔を1秒以上空けるようにする。
 * Pragma:No-cacheメタタグが設定されているページはダウンロードしない。
 * rel=”nofollow”が設定されているリンクはクローラーで辿らない。
 * 会員のみが閲覧できるページの場合は利用規約を守る。
 * 情報収集を禁止する措置(ex.アクセス制限)がクローリング時に取られていた場合は、既に取得していた情報を含めて削除する。
 ※参考:著作権法第47条(6)

データを公開する時

集計データを公開する場合は許可を取る必要はない。

ただし、個人が特定されるデータの場合は許可を取る必要がある。

 ※著作権法は創作を保護する為の法律で、事実(ex.〇〇が△△個あった)は保護の対象にならない。
 

個別データを公開する場合は許可を取る必要がある。

ただし、Web検索サービスで先方のサイトを紹介する為の利用は除きます。
(キャッシュ配信型のキュレーションサービスは、Web検索サービスと認められない可能性があります)

 ※参考:著作権法第47条(6)

著者のスタンス

著者は、著作権法第47条の7の情報解析目的であっても、第47条の6の制約を守った方が良いと考えています。
著作権法第47条の6は、検索サービス事業の一部を行う者も対象で、「ソフトウェアによるウェブサイト情報の収集・格納(クローリング)」はその一部です。
ただし、情報解析目的の場合は第47条の6の制約を守らなくても良いというのが一般的な解釈です。
※参考:著作権法47条の6の解説(PDF) - きたおか法律事務所

Q&A(2014/12/03 追記)

疑問点とそれに対する回答を書きました。
→ Webスクレイピングの法律周りの話をしよう!

記事のライセンス

cc-by.png
@nezuq

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1469