RAGとは、一言で言うと、ChatBotなどの言語モデルに外部情報(知識データベース)の参照機能を追加することで回答の信頼性を高める技術のことです。2020年のMeta社の論文で提唱された概念です。
LinkedInにすごくよくまとまっているRAGの紹介がありました。
検索と生成の2つのフェーズ
名前にある通り情報検索(Retrieval)と情報生成(Generation)の2つのフェーズがあります。最初の検索フェーズでは、質問テキストと外部文書(知識データベース)の相関性により上位k位の文書を取り出します。その後、その上位の文書と質問テキストをつなげて、言語モデルを使って回答文を生成します。
オープンブック方式とは?
オープンブック方式とは大学などで行われる辞書や教科書の持ち込み可の試験のことです。外部の情報を取り入れることで学生は暗記する労力を少なくすることができます。RAGはこのオープンブック方式をとっています。
RAGは回答の信頼性を高める
RAGでは、外部の知識データベースから最新の情報を取得するので、回答の信頼性を高めることができます。更に、元の言語モデルを頻繁に更新する必要性が減るので、更新コストが削減できます。
RAGのシステムを利用することで、ChatBotなどの言語モデルは、低コストで回答の信頼性を高めることできるのです。