1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

OpenAIのAIモデル利用における法的リスク分析

Posted at

OpenAIのAIモデル利用に関して、学習データに起因する法的リスクを、同社の公式見解および日本、米国、欧州連合(EU)の規制を基に、法的観点から包括的に分析します。


1. 「違法な学習データ」の定義と各法域の考え方

AI学習データが「違法」と見なされるかは各国の著作権法の解釈に依存し、保護されたコンテンツの無許諾利用が権利侵害にあたるかが最大の争点です。

日本:原則適法(非享受目的利用)

日本の著作権法は、AI開発を目的とした著作物の利用を、思想・感情の享受を目的としない「非享受目的利用」として原則適法と定めています。

著作権法第30条の4では、情報解析等に伴い著作物を利用する場合のような著作物に表現された思想又は感情の享受を目的としない利用行為(非享受目的で行われる利用行為)は、原則として著作権者の許諾なく行うことが可能とされています。

文化庁, "AIと著作権に関する考え方について(令和6年3月)"

ただしこの原則は、「著作権者の利益を不当に害する」場合には適用されません。例えば、AI学習用に市販されているデータベースの無断複製などがこれに該当する可能性があります。

AI学習用のデータセットとして、有償で提供されているデータベース著作物を、AI学習のために無許諾で複製等する場合は、「著作権者の利益を不当に害することとなる場合は、この限りでない」とする著作権法第30条の4ただし書に該当する可能性があることが示されています。

オーセンス法律事務所, "AIと著作権に関するチェックリスト&ガイダンスについて弁護士が解説"

米国:フェアユース(公正な利用)を巡る法的不確実性

米国では、著作物の利用が「フェアユース」に該当するかが争点であり、OpenAIは自社のAI学習がこれにあたると主張しています。

公開されているインターネット上の資料を用いてAIモデルを訓練することは、長年にわたる広く受け入れられた判例に裏付けられており、フェアユースにあたります。(原文は英語、編集部訳

Training AI models using publicly available internet materials is fair use, as supported by long-standing and widely accepted precedents.

OpenAI, "OpenAI and journalism"

しかし、この見解は法的に未確定であり、米国著作権局が指摘するように、多数の訴訟が進行中で高い法的不確実性が残ります。

米国では、著作権のフェアユース原則の適用に焦点を当てた訴訟が数十件係属中です。(原文は英語、編集部訳

Dozens of lawsuits are pending in the United States, focusing on the application of copyright’s fair use doctrine.

U.S. Copyright Office, "Copyright and Artificial Intelligence, Part 3: Generative AI Training (Pre-Publication Version)"

EU:TDM例外と権利者のオプトアウト尊重

EUでは、著作権指令がテキスト・データマイニング(TDM)の例外を認めつつ、権利者が機械可読な形式で利用を拒否(オプトアウト)する権利を保障しています。

(DSM著作権指令第4条によれば)権利者は、オンラインで公衆がアクセス可能な著作物について、機械が読み取り可能な手段で、その権利を適切な方法で留保することができます。(原文は英語、編集部訳

the rights holders may expressly reserve the use of their works and other subject matter in an appropriate manner, such as machine-readable means in the case of content made publicly available online.

EUR-Lex, "Directive (EU) 2019/790 on copyright and related rights in the Digital Single Market"

さらにEU AI法は、汎用AIモデル提供者に対し、学習データの「十分に詳細な要約」を公開する透明性義務を課しています。

汎用AIモデルの提供者は、モデルの学習に用いられたコンテンツについて、十分に詳細な要約を作成し、公開しなければならない。(原文は英語、編集部訳

providers of general-purpose AI models shall (...) draw up and make publicly available a sufficiently detailed summary about the content used for training of the general-purpose AI model.

Official Journal of the European Union, "Regulation (EU) 2024/1689 (AI Act)"


2. OpenAIが使用する学習データと透明性

OpenAIは、学習データが複数のソースから構成されていると説明しています。

OpenAIは、公開情報源、ライセンスされた第三者のデータ、そして人間のレビュー担当者が作成した情報など、さまざまな場所のデータを使用しています。(原文は英語、編集部訳

OpenAI uses data from different places including public sources, licensed third-party data, and information created by human reviewers.

OpenAI, "Enterprise privacy at OpenAI"

しかし、競争上の理由からGPT-4以降のモデルの学習データ詳細は開示されておらず、この透明性の欠如が利用者のリスク評価を困難にしています。

OpenAIはChatGPTの驚異的な成功の基盤となったモデルであるGPT-3の訓練に使用された学習データの正確な構成について情報を公開していましたが、その後継であるGPT-4のリリース後はそのような情報共有は行われませんでした。(原文は英語、編集部訳

While Open AI still published information about the exact composition of the training data used to train GPT-3, the model underpinning the breakout success of ChatGPT, no such information was shared following the release of its successor, GPT-4.

Open Future, "Advancing Training Data Transparency in the EU AI Act"


3. 利用者のリスクとOpenAIの責任範囲

学習データの権利問題を巡る不確実性に対し、OpenAIは利用者リスクを軽減するための措置を講じています。

リスク①:第三者からの著作権侵害クレームと軽減策 (Copyright Shield)

OpenAIは企業向けサービス利用者に対し、AI生成物が著作権侵害で訴えられた場合に法的費用を負担する「Copyright Shield」プログラムを公式に発表しています。

Copyright Shield。OpenAIは、我々のシステムに組み込まれた著作権保護機能でお客様を保護することに尽力しています。本日、我々はさらに一歩進んでCopyright Shieldを導入します。これにより、お客様が著作権侵害に関する法的請求に直面した場合、我々が介入し、お客様を防御し、発生した費用を支払います。これは、ChatGPT Enterpriseおよび我々の開発者プラットフォームの一般利用可能な機能に適用されます。(原文は英語、編集部訳

Copyright Shield. OpenAI is committed to protecting our customers with built-in copyright safeguards in our systems. Today, we're going one step further and introducing Copyright Shield—we will now step in and defend our customers, and pay the costs incurred, if you face legal claims around copyright infringement. This applies to generally available features of ChatGPT Enterprise and our developer platform.

OpenAI, "New models and developer products announced at DevDay"

リスク②:学習データの「記憶化(Regurgitation)」

AIモデルが学習データをそのまま出力する「記憶化」は、著作権侵害の直接証拠となり得ます。OpenAIはこの問題を稀なバグとして認識し、対策を進めていると説明します。

「記憶化」は稀なバグであり、我々はこれをゼロにすべく取り組んでいます。(原文は英語、編集部訳

“Regurgitation” is a rare bug that we are working to drive to zero.

OpenAI, "OpenAI and journalism"

リスク③:出力内容に関する最終責任

OpenAIの利用規約は、出力の所有権は利用者に帰属する一方、その利用に関する最終責任も利用者が負うことを明確にしています。

お客様は、出力のすべての使用について単独で責任を負い、お客様のユースケースに対する出力の正確性と適切性を評価する責任があります。(原文は英語、編集部訳

Customer is solely responsible for all use of the Outputs and for evaluating the accuracy and appropriateness of Output for Customer’s use case.

OpenAI, "OpenAI Services Agreement"

これは、Copyright Shieldの補償範囲外(名誉毀損など)や生成物の品質に関するリスクは、利用者が管理する必要があることを意味します。


最終的な分析と結論

ご質問の「違法な学習データを用いて作成したモデルを利用者が使用するリスク」について、以下の通り結論付けます。

  1. 学習データの内容と適法性
    OpenAIは学習データについて「公開情報、ライセンスデータ、人間が作成した情報」と説明しますが、GPT-4以降はその詳細を公開していません。このデータの適法性については、日本では著作権法第30条の4に基づき情報解析目的での利用は原則適法ですが、米国では「フェアユース」を巡る訴訟が多発し法的に未確定、EUでは透明性義務と権利者のオプトアウト権が定められており、世界的に見解が統一されていないのが現状です。

  2. 利用者のリスク有無
    リスクは存在します。 主なリスクは、モデルの出力が学習データに含まれる著作権保護コンテンツを複製・類似してしまうことにより、第三者から著作権侵害を主張される可能性です。学習データの全容が不透明である以上、このリスクを完全にゼロにすることはできません。

  3. リスクに対するOpenAIの対策と利用者の責任
    OpenAIは、このリスクを軽減するため、企業向け利用者に対して**「Copyright Shield」という法的補償制度を提供しています。これにより、著作権侵害で訴えられた際の訴訟費用や賠償金といった経済的リスクの大部分は、OpenAIが負担**します。

    しかし、これは全てのリスクを免責するものではありません。利用者は以下の最終的な責任を負います。

    • 出力内容の確認義務:「記憶化(Regurgitation)」によって既存の著作物と酷似した出力がなされていないかを確認し、修正する責任。
    • 補償範囲外のリスク管理:著作権以外の問題(名誉毀損、プライバシー侵害、事実誤認など)や、事業目的への適合性を判断する責任。

結論として、OpenAIモデルの利用者が違法学習データに起因して直面する法的リスクは「存在するが、企業向けサービスにおいては経済的リスクが契約によって大幅に軽減されている」と言えます。 利用者は、OpenAIの補償制度を安全策としつつも、生成されたコンテンツをレビュー・管理する実務的な体制を構築することが、最も現実的かつ安全な利用方法となります。

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?