LoginSignup
11
7

ChatGPTに入力したデータはどう使われるのか

Last updated at Posted at 2023-04-04

はじめに

使えるタイミングが来たらGPT-4のAPIを使ってこんなアプリ作りたいなーなどと夢を膨らませていますが、そもそも使った場合にデータはどんな使われ方をするのか、使われないようにする方法はあるのか気になったので調べました。

機密情報を含んだデータを使えるか次第で現実的に作れるアプリも変わりますしね。学習で使われるんだろうなと思っていますが、一度見てみようと思いました。

時間のない方は、まとめだけ読めば大丈夫です。

2023年4月26日更新事項
データをトレーニングに使われないようにするオプションChat History & Trainingについて追記しました。

Data usage policiesを読んでみる

まずはどんなドキュメントがあるのか見ていると、Data usage policiesという今回まさに読みたいタイトルのドキュメントがありました。

抜粋と翻訳

Updated March 1, 2023と記載がありますのでその時点の情報になります。

重要そうな部分を抜粋してざっくり訳していきます。

OpenAI will not use data submitted by customers via our API to train or improve our models, unless you explicitly decide to share your data with us for this purpose. You can opt-in to share data.
[訳] OpenAIは、明示的にあなたがデータを共有することを決めない限り、API経由でユーザーから提供されたデータをモデルのトレーニングや改善に利用することはありません。あなたはデータ共有をオプトイン(許諾する)することができます。

データは使われるものだとばかり思っていましたが、こちらから申し込まない限り使われないと記載がありました。

モデルの改善に協力したい方はこちらのフォームから申し込むことができます
OpenAI Data Sharing Opt In

「API経由で」と明記されているのでブラウザでChatGPTのアプリを使っている際はガッツリ使われているのでしょうか。気になったのでこちらも調べてみました。

API経由じゃない場合

ChatGPTにログインし、FAQを探していると答えが見つかりました。

以下、抜粋と訳です。

When you use our non-API consumer services ChatGPT or DALL-E, we may use the data you provide us to improve our models. You can request to opt-out of having your data used to improve our non-API services by filling out this form with your organization ID and email address associated with the owner of the account.
[訳] あなたがAPIではないユーザー向けのサービスであるChatGPTやDALL-Eを使っている場合、あなたの提供したデータをモデルの改善に使うことがあります。あなたは組織ID、アカウント所有者のメールアドレスをこのフォームに入力することで、データがサービスの改善に利用されることに対してオプトアウト(許諾しない)のリクエストができます。

やはり、API経由と明記されているのには意味があり、経由しないで入力されたデータに関しては使われると書かれています。しかし申し込みをすればこれも回避できる、ということですね。

オプトアウト申し込みフォームはこちら
OpenAI Data Opt Out Request

この申し込みをするか、APIを使ってChatbotでも作ってそれ経由でチャットすればいいですね。

2023年4月26日追記
ブラウザ版であってもトレーニングに利用されないようにするオプションが追加されました。

Settings > Data Controls からChat History & Trainingを無効にすればOKです。

留意事項としてはChatの履歴もオフになります。ちなみにこのオプションを無効にした瞬間に過去の履歴が全て消えるようなことはありません。

また、トレーニングには使用されなくなりますが、監視のために最大で30日は保持すると記載がありますのでその点もご留意ください。

抜粋と翻訳(続き)

Data usage policiesの内容に戻ります。

Any data sent through the API will be retained for abuse and misuse monitoring purposes for a maximum of 30 days, after which it will be deleted (unless otherwise required by law).
[訳] API経由で送られたデータは不正使用、悪用を監視する目的で最大30日間保持され、その後削除されます

監視のために最大で30日は保持すると記載がありました。
つまり、利用されなくてもデータは監視担当の人に見られる可能性がある、ということになります。

読み進めます。

A limited number of authorized OpenAI employees, as well as specialized third-party contractors that are subject to confidentiality and security obligations, can access this data solely to investigate and verify suspected abuse.
[訳] 限られた人数の認可されたOpenAIの従業員と、機密保持及びセキュリティ義務を遵守するサードパーティの請負業者が、不正使用の調査・確認を目的とする時のみ、このデータにアクセスできます。

保持されたデータを見るのは、限られたメンバーがしかも調査する時だけ、ということですね。

Enterprise customers deploying use cases with low likelihood of misuse may request to not have API data stored at all, including for safety monitoring and prevention.
[訳] 悪用される可能性が低いユースケースの企業のユーザーは安全性の管理、予防の観点を含めて、APIのデータを全く保存しないようにリクエストできる場合があります。

場合によっては全くデータを保存しないようにリクエストできるとのことですが、基準などは記載がありません。

Note that this data policy does not apply to OpenAI's Non-API consumer services like ChatGPT or DALL·E Labs. You can learn more about these policies in our data usage for consumer services FAQ.
[訳] このポリシーはAPIを使っていないサービス(ChatGPTやDALL·Eなど)には適応されません。こららのポリシーはFAQで説明してます。

先ほど先に読んでしまいましたが最後にも書いてありました。このポリシーはあくまでAPIの話でそれ以外には適応されないのでご注意ください。

Can we self-host?
We do not offer on-premise hosting. You may purchase dedicated capacity by reaching out to our sales team.
[訳]
セルフでホストできますか?
オンプレ版は提供してませんが、専有の容量を購入できます。

オンプレに立てることはできないけど、専有環境を買うことはできるようですね。

まとめ

  • APIを使ってもデータは使われることはない
  • 使われないけど最大30日間は保持される
  • 限られた人に限られたタイミングだけだけど見られる可能性がある

また、こちらも一応頭の片隅に入れておきたいです。

  • ユースケースによってはリクエストが通れば全くデータを溜めないようにできる
  • 専有環境(詳細不明)も存在する

最後になりますが、こんな記載もありました。

Data submitted to the API prior to March 1, 2023 (the effective date of this change) may have been used for improvements if the customer had not previously opted out of sharing data.
[訳] 2023年3月1日以前にAPI経由で送られたデータに関しては、オプトアウトしてない場合はモデルの改善に利用された可能性があります。

このポリシーになる前は使われている可能性がある、とのことです。
今後もポリシーは変わるでしょうから、ウォッチしていこうと思います。

おまけ

ChatGPT APIを使う場合に気をつけたいお金にまつわる話も書いてみました。気になる方はどうぞ。

11
7
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
11
7