はじめに
生成AIの回答の精度を上げる手法として、RAG(Retrieval-Augmented Generation, 検索拡張生成)が注目されています。この記事では、RAGについて簡単にまとめてみました。
RAGとは?
RAGとは、大規模言語モデルによるテキスト生成に、外部情報の検索を組み合わせることで、回答精度を向上させる技術のことです。
ファインチューニングとの違い
生成AIの回答の精度を上げる手法で、RAGのほかにファインチューニングもあります。
ファインチューニングは、特定のデータセットに対して学習を行うことで、回答の精度を上げる手法です。ただし、ファインチューニングには以下ような問題点が挙げられます。
- 新しい情報に対して回答できるようにするため都度学習を行う必要がある
- 機密情報が学習に使われてしまう恐れがある
RAGでは、外部の情報を使って回答を生成するため、新しい情報に対して回答できるようにするために学習したり、学習に機密情報が使われる恐れはありません。
RAGの応用例
RAGを使うことで、社内マニュアルなどの検索は簡略化できると思われます。社内マニュアルは機密情報を扱っている場合があり、その内容を学習に使うことは憚れます。RAGを使えば、その内容を学習せずに回答内容に利用することができます。
機密情報を扱っていなかった内容だとしても簡略化できることがあります。それは、サービスのマニュアルを調べることやカスタマーサポートです。普段はユーザーが提供されているマニュアルを調べたり、調べたりしてわからないことがあればカスタマーサポートにお問い合わせしていたことも、RAGを使えば簡略化できます。
さいごに
今回は、RAG(Retrieval-Augmented Generation, 検索拡張生成)について簡単にまとめました。