はじめに
AI技術の進歩はものすごい勢いで加速していますね。そのため、少しでもAIに関する知見を身につけておくことが重要です。今回、RAGについて調査する機会があったので、まずざっくりと理解したことをまとめてみました。内容に誤りがあれば、ご指摘いただけると幸いです。
RAGとは
RAGとはRetrieval-Augmented Generationの略で、リトリーバル アグメンテッド ジェネレーションと読みます。また、「ラグ」とも呼ばれます。これはLLM(大規模言語モデル)に外部ソースを渡して回答の精度を高める仕組みです。
イメージ的には、LLMにカンニングさせて回答の精度を上げるような感じです。
RAGにできること・できないこと
回答の精度を上げる具体例として、以下の「できること」があります。また、RAGの限界を理解して使うことが重要です。「できないこと」についても知っておきましょう。
できること
- LLMが時々いい加減な回答をする現象(ハルシネーション)を減らすことができる
- LLMの回答の精度を高めることができる
- LLMに専門的な回答をさせることができる
できないこと
- 100%の精度で回答すること
- 参照するデータ以外の情報に基づいた回答をすること
RAGを活用事例
RAGの活用例はさまざまですが、主に以下のような用途で利用されています。
社内ヘルプデスク
社内データを参照させることで、「〇〇会議資料をちょうだい」や「社内ルールを教えて」といった質問に対して資料を提供したり、社内ルールについて教えることができます。
市場調査
社内で調査した情報とネット検索を組み合わせて、精度の高いレポートを迅速に作成することができます。
お問い合わせチャットボット
過去の問い合わせ情報を参照させることで、類似する問い合わせに対して自動で回答させることができます。
構築方法
「こんな感じで作るんだ!やってみたい!」と思った記事を3つピックアップしました。ぜひ参考にしてみてください。
- RAGを使った社内情報を回答できる生成AIボットで業務効率化してみた
- 【RAG構築】データソース(Web検索)の利用
- AWS 内で大規模言語モデルを利用できる Amazon Bedrock を使って作る RAG アプリケーション
さいごに
今度は実際にRAGを使用してみて、理解を深めていきたいと思います。
参考