0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

プロンプトだけじゃない、渡したデータすべてが学習材料に?4大AIサービスの規約を比較してみた

0
Posted at

プロンプトだけじゃない、渡したデータすべてが学習材料に?4大AIサービスの規約を比較してみた

KimiやDeepSeekといった話題のオープンウェイトモデルは、いまや様々なプラットフォーム経由でAPI利用できるようになりました。Cloudflare Workers AI、OpenRouter、Hugging Face Inference Providers、そしてAWSやGoogle Cloudといった大手クラウドベンダーも、こぞって対応モデルを増やしています。

便利になった一方で気になるのが、送信した内容がどう扱われるかという点です。AIに渡しているのは普段のプロンプトだけではありません。ファインチューニング用にアップロードした学習データ、RAGに読み込ませた社内資料、添付した画像やコードなど、気づかないうちに渡しているデータは意外と多いものです。「これらがそのままモデルの学習に使われたりしないだろうか」と一度は考えたことがある方も多いのではないでしょうか。

今回は4つのプラットフォームグループの公式ドキュメントを読み比べ、データの学習利用に関する規約のポイントを整理してみました。

1. Cloudflare Workers AI

概要

Cloudflare Workers AIは、Cloudflareのグローバルネットワーク上でAIモデルを動かせるサーバーレス推論サービスです。公式モデルカタログには、Kimi K2やDeepSeek-R1-Distill-Qwen-32Bといった注目のオープンウェイトモデルも並んでいて、エッジ環境から低レイテンシで呼び出せます。

学習利用ポリシーのポイント

公式ドキュメント「Data usage」には、入力データや出力データを含む情報が「Customer Content」として扱われると定義されています。そのうえで、ユーザーの明示的な同意がない限り、Cloudflareはこれらのデータをモデルの学習やサービス改善に使用しないと明記されています。他の顧客へデータを共有することもないとされており、方針自体はかなりシンプルです。

なお、Cloudflareは自らモデルを開発・学習させているわけではありません。提供しているのはあくまでサードパーティのモデルという位置づけで、モデルごとのライセンス条件は別途確認が必要になります。

優位性

学習利用に関する方針が非常に分かりやすく、同意なき学習利用は明確に禁止されている点は安心材料です。さらにKimiやDeepSeekのような最新モデルを、Cloudflareのエッジネットワークから直接呼び出せる手軽さも魅力でしょう。

注意点

R2やKVなどのストレージサービスと組み合わせて使う場合は、そちらのデータ保存ポリシーも合わせて確認したほうが安心です。モデル自体のライセンス条件もモデルごとに異なるので、利用前に一度目を通しておくとよいと思います。

2. OpenRouter

概要

OpenRouterは複数のAIプロバイダーへリクエストを振り分ける、いわゆるルーティング型のサービスです。KimiやDeepSeekも複数のプロバイダー経由で利用できます。自社でモデルを学習しているわけではないため、「OpenRouter自身のポリシー」と「実際に推論を行うプロバイダーのポリシー」が分かれている点が特徴です。

自社ポリシーのポイント

デフォルトではプロンプトや応答内容を保存しない設計になっています。ただし、ログを閲覧できるようにする「Private Input & Output Logging」と、製品改善に使う「OpenRouter Use of Inputs/Outputs」という2つのオプトイン設定が用意されていて、後者を有効にすると利用料が1%割引になります。

ここで注意したいのが、ログ機能を有効にした場合の権利許諾の範囲です。利用規約には、プロンプトロギングを有効にすると、ホスト・保存・改変・翻案・派生作品の作成・配布などを含む、商業目的での利用も可能な広い権利をOpenRouterに許諾することになると記載されています。割引と引き換えにどこまでの権利を渡すのか、利用前に把握しておきたいポイントです。

接続先プロバイダーのポリシー

学習に関しては、アカウント設定で「学習を行うプロバイダーへのルーティングを許可するかどうか」を選べる仕組みになっています。個々のリクエストやアカウント全体で、データポリシーによるプロバイダーのフィルタリングも可能です。

優位性

数百のモデル・プロバイダーを単一のAPIから呼び出せる柔軟性は大きな強みです。データポリシーによるフィルタリングやゼロデータ保持(ZDR)限定設定など、利用者側でコントロールできる範囲が広いのも特徴といえます。

注意点

ログ機能をオンにすると商業利用を含む広い権利許諾が発生する点は、事前にしっかり確認しておきたいところです。また、実際の学習利用の有無はあくまでプロバイダー次第であり、OpenRouter自身がそれを保証するものではありません。

3. Hugging Face Inference Providers

概要

Hugging Faceも「Inference Providers」という機能を通じて、Novita・DeepInfra・Togetherなど複数の外部プロバイダー経由でKimiやDeepSeekといったモデルにアクセスできます。OpenRouterと同様、自社ポリシーと接続先プロバイダーのポリシーが分かれている構造です。

自社ポリシーのポイント

公式ドキュメント「Security & Compliance」には、学習目的でユーザーデータを保存することはないとはっきり書かれています。ルーティング時にリクエスト本文やレスポンスも保存されず、デバッグ用のログも最大30日間のみで、ユーザーデータやトークンは含まれないとされています。

接続先プロバイダーのポリシー

実際の推論は外部プロバイダーが担うため、各社のデータ取り扱いについてはプロバイダー個別のドキュメントを確認する必要があります。Hugging Face自身はあくまで橋渡し役という立ち位置です。

優位性

Hugging Face自身の方針が明確で、ドキュメントもシンプルにまとまっています。機能の基盤となるHub全体がSOC2 Type2認証を取得済みという点も、企業利用を検討する際の安心材料になりそうです。

注意点

実際に処理するのは多くの場合外部プロバイダーであり、機密性の高いデータを扱う際はルーティング先のプロバイダーがどこなのか、そのプロバイダーのポリシーがどうなっているかまで確認したほうが安心です。

4. クラウドベンダー(AWS / Google Cloud)

AWS(Amazon Bedrock)

Amazon Bedrockは、ClaudeやAmazon Titanだけでなく、DeepSeekやKimiといったオープンウェイトモデルもフルマネージドで提供しています。2026年2月にはDeepSeek V3.2やKimi K2.5などが新たにラインナップへ加わりました。

データの取り扱いについては、公式ドキュメント「Data protection」に明確な記載があります。プロンプトと生成結果は保存・ログ記録されず、AWSのモデル学習にも使用されず、第三者へ配布されることもないとされています。技術的な裏付けとして、モデル提供者ごとに専用の「Model Deployment Account」が用意されていて、モデルの提供元企業自身もユーザーのプロンプトやログにアクセスできない設計になっているのが特徴です。

Google Cloud(Vertex AI)

Vertex AIのModel Gardenでも、DeepSeekやKimiが管理API(MaaS)として利用できます。ただしDeepSeekのようなGoogle以外のモデルについては、「Separate Offerings」という別枠の利用条件が適用される点に気をつけたいところです。

学習利用に関しては、Service Specific Termsの「Training Restriction」という条項が根拠になっています。事前の許可や指示がない限り、ユーザーのデータをAI/MLモデルの学習やファインチューニングに使用しないとされ、GA版・pre-GA版を問わずVertex AI上の管理対象モデル全体に適用されます。Gemini自体についても、プロンプトや応答が学習データとして使われることはないと明記されています。

ただし、完全に何のログも残らないわけではありません。不正利用検知のため、Google Cloud Platform利用規約に基づいてプロンプトがログ記録される場合があり、完全なゼロデータ保持を希望する場合は別途例外申請が必要になります。

優位性(AWS/Google Cloud共通)

グローバル大手としての信頼性と、SOC・ISO・HIPAAなどコンプライアンス対応の充実は大きな強みです。専用VPCや暗号化キー管理といったエンタープライズ向けのセキュリティ機能も豊富にそろっています。さらに、学習制限が契約書(Service Terms)レベルで明文化されている点も心強いポイントでしょう。

注意点(AWS/Google Cloud共通)

サードパーティのオープンウェイトモデルには、プラットフォーム側の規約に加えて別途ライセンス条件やSeparate Offeringsが適用されます。また、不正利用監視のためのログ記録は別枠で行われる場合があり、完全なゼロデータ保持には申請が必要になるケースもあるので留意しておきたいです。

4グループまとめ比較表

項目 Cloudflare Workers AI OpenRouter Hugging Face Inference Providers AWS / Google Cloud
概要 エッジ上で動くサーバーレスAI推論サービス。サードパーティモデルをホスト 複数プロバイダーへリクエストを振り分けるルーティング型サービス 複数の外部プロバイダー経由でモデルへアクセスする橋渡し役 フルマネージドなクラウドAIプラットフォーム(Bedrock/Vertex AI)
学習利用ポリシー 同意なき学習利用を明確に禁止 デフォルトは保存・学習しないが、オプトインで利用可能になる設定あり 学習目的でのデータ保存を明確に否定 契約書レベルで学習制限を明文化(Training Restrictionなど)
優位性 方針がシンプルで分かりやすい。エッジ経由の低レイテンシ 柔軟なプロバイダー選択とZDR等の細かい制御が可能 自社方針が明確。HubはSOC2 Type2認証取得済み コンプライアンス対応が充実。VPCや暗号化等のセキュリティ機能が豊富
注意点 モデル別ライセンスは個別確認が必要 ログ機能オンで広範な商業利用権を許諾してしまう 実処理は外部プロバイダー任せのため個別確認が必要 サードパーティモデルは別ライセンス、不正監視ログは別枠

まとめ

4つのグループを見比べてみると、Cloudflare・Hugging Face・AWS・Google Cloudは「プラットフォーム側はデフォルトで学習に使わない」という方針を明確に打ち出している点が共通していました。

一方でOpenRouterは、利用者がログ機能をオンにした場合に商業利用を含む権利許諾が発生するなど、設定次第で扱いが変わる柔軟さ、そして注意点を併せ持っています。また、OpenRouterとHugging Faceはルーティング型サービスという特性上、実際に処理を行う外部プロバイダーのポリシーまで確認する必要がある点も共通の注意点といえそうです。

KimiやDeepSeekのような魅力的なオープンウェイトモデルを使う際は、便利さだけでなく、こうした規約面の違いも踏まえてプラットフォームを選んでいただければと思います。

この記事がどなたかのお役に立てれば幸いです。


参考にした公式情報源

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?