目的
VSCodeの拡張機能の「Codeium」がとても便利だった。ChatGPTのようにプロンプトからコードを生成したり、コードのリファクタリング、コードを元にした回答、ドクストリングの生成がVSCode上で行える。
特にオートコンプリートは、ChatGPTでできない機能であり、かなり便利(1行目を入力すると関数の中身が提案された)↓。
企業で使う場合は入力したデータの取り扱いが重要なので、関係箇所を調べてみた。
情報管理に関わる項目
privay policy
FAQs
Terms of Service: Individual
要点
- 開発元は、Exafunction
- サーバーは米国にある。
- オートコンプリート機能では、生成モデルのためにデータが使われることはない。ただし、識別器(提案されるコードのスコア化やランク付け)に使用されることがある。オプトアウトの申請は、メールまたはユーザー設定で変更可能。オプトアウトした場合でも、一旦コンテンツはExafunction社のサーバーに送信される。
- チャット機能は、生成モデルと識別器の両方の学習にデータが使用されることがある。また、オプトアウトの設定にした場合は、チャット機能が使えない。
- 有料版(teams)だと、Zero-day retentionと記載があり、データが保持されない模様。また、Enterprise版だとセルフホストも可能で、この場合は開発元もデータにアクセスできない高度なセキュリティ設定が実現できる。
Price
セキュリティの観点を除けば、Individualも十分な機能を持っている。
所感
- 無料版で機能を有効に使おうとすると、入力したデータは使われる。特にChat機能はWebUIのChatGPTに入力するのと同様の扱いに読める。個人使用には良いが、企業での機密情報の入力用途には適していないように見える。逆にChatGPTを使っている人は、同様の取り扱いで使えば良いと思う。
- 企業で使う場合には、TeamsかEnterprise版が推奨される。価格の記載はないものの、オンプレやクラウド上でのセルフホストによりGithub Copilotより安全な環境が構築できるのはメリット。
- With Codebase(コードを参照して回答する機能)については、説明がないが、恐らくRAG(Retrieval Augmented Generation)でおこなっていると考える。その場合、検索で引っかかったコードの一部がプロンプトとして送信されるため、コードが学習に使われる可能性があるのでは、と思う。
- オートコンプリート機能凄いと思った。。。Github Copilotかどちらかは導入したい。