Bedrockで提供される生成AIモデルを選定する際に重視すべき点
『モデルがどのようなトレーニングデータで学習されているか』
具体的には、2つの観点があります。
-
トレーニングデータの種類が与える影響
- 生成AIモデルの性能や応答精度は、そのモデルがどのようなデータでトレーニングされているかに強く依存します。
- 特に特定の業界や専門分野で利用する場合、モデルがその分野に関連するデータで十分に学習されていると、より精度の高い応答が期待できます。
-
トレーニングデータの適合性の重要性
- 企業が生成AIを実際の業務に活用する場合、例えば法務、医療、金融といった分野では、一般的なデータよりもその分野の専門知識が反映されたデータが必要です。
トレーニングデータの管理方法
Bedrockを使用して基盤モデルのトレーニングを行う際に、トレーニング管理方法として適切なアプローチは、
『元のモデルに直接トレーニングデータは使用されず、コピーされたモデルでのみトレーニング』
が行われます。
自社で入力したプロンプトの中に、会社の機密情報のような社外にでてはいけないデータがあったとしても、基盤モデル側(Claudeなど)で利用されないということになります。