背景
AIと人間の対話能力の向上に対する需要が高まっている中、対話型AIの訓練方法も進化している。
初期のGPTモデルのトレーニングでは、「PromptとCompletion」の形式が一般的であった、より自然で人間らしい対話を実現するために、「UserとAssistant」の形式へと移行している。
PromptとCompletionの形式
- 特徴: あるテキストの書き出し(Prompt)に対して、AIがどのようにしてそれを完了(Completion)させるかに焦点を当てた形式
- データ:プロンプト(入力テキストの書き出し)とコンプリーション(プロンプトに基づくテキストの完了)のペア
- 応用: 物語の続きを書く、文章の生成、特定のテーマに基づくテキスト生成など
- 限界: ある程度の質問が作れるひと向けに、単一の応答を生成することに重点が置かれており、継続的な対話や文脈を考慮した応答の生成には不向(玄人向き)
UserとAssistantの形式
- 特徴: ユーザー(User)とAIアシスタント(Assistant)との間の一連の対話を通じて、文脈を理解し、適切に反応する能力をAIに学習させる形式
- データ: ユーザー(人間)の質問と、アシスタント(AI)の応答のペアの複数セット(文脈を考慮するため)
- 応用: カスタマーサポート、個人アシスタント、教育ツールなど、ユーザーとの対話を必要とするさまざまなアプリケーション
- メリット: ユーザーの質問やコメントに対して、より自然で人間らしい対話を実現。文脈を踏まえた応答や、継続的な対話が可能(初心者向き)
結論
トレーニングデータのPromptとCompletion形式からUserとAssistant形式への進化は、AI技術の発展と共に、人間と自然に対話できるAIの需要が高まっていることを反映している。
この変化は、AIが提供できる対話体験の質を大幅に向上させ、日常生活やビジネスのさまざまな場面でのAIの活用をさらに促進すると思われる。