More than 1 year has passed since last update.

GPTのfine-tuningのトレーニングデータの形式がなぜ変わったのか？

Posted at 2024-03-18

背景

AIと人間の対話能力の向上に対する需要が高まっている中、対話型AIの訓練方法も進化している。
初期のGPTモデルのトレーニングでは、「PromptとCompletion」の形式が一般的であった、より自然で人間らしい対話を実現するために、「UserとAssistant」の形式へと移行している。

PromptとCompletionの形式

特徴: あるテキストの書き出し（Prompt）に対して、AIがどのようにしてそれを完了（Completion）させるかに焦点を当てた形式
データ：プロンプト（入力テキストの書き出し）とコンプリーション（プロンプトに基づくテキストの完了）のペア
応用: 物語の続きを書く、文章の生成、特定のテーマに基づくテキスト生成など
限界: ある程度の質問が作れるひと向けに、単一の応答を生成することに重点が置かれており、継続的な対話や文脈を考慮した応答の生成には不向（玄人向き）

UserとAssistantの形式

特徴: ユーザー（User）とAIアシスタント（Assistant）との間の一連の対話を通じて、文脈を理解し、適切に反応する能力をAIに学習させる形式
データ：ユーザー（人間）の質問と、アシスタント（AI）の応答のペアの複数セット（文脈を考慮するため）
応用: カスタマーサポート、個人アシスタント、教育ツールなど、ユーザーとの対話を必要とするさまざまなアプリケーション
メリット: ユーザーの質問やコメントに対して、より自然で人間らしい対話を実現。文脈を踏まえた応答や、継続的な対話が可能（初心者向き）

結論

トレーニングデータのPromptとCompletion形式からUserとAssistant形式への進化は、AI技術の発展と共に、人間と自然に対話できるAIの需要が高まっていることを反映している。
この変化は、AIが提供できる対話体験の質を大幅に向上させ、日常生活やビジネスのさまざまな場面でのAIの活用をさらに促進すると思われる。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up