ここ最近、Amazonにて RAG(Retrieval-Augmented Generation)の精度改善 をテーマにした書籍を出版しました。
書籍はこちらからご覧いただけます:
本を書くきっかけ
これまでRAG精度改善に関する記事をいろいろ書いてきましたが、そのなかで「改善の手法って本当にたくさんあるな」と実感しました。
論文や記事で中身を紹介しているものは多いけれど、実際に全部試して「どれが有効だったのか」まで踏み込んで整理されているものは少ないんですよね。
そこで、自分が実際に試して効果を感じた方法をまとめて紹介しようと思い、この本を書きました。
RAGをまったく知らない方でもゼロから理解できるように構成しています。
本の内容
本書は大きく三章構成になっています。できるだけシンプルに、かつ実務でも参考できる形を意識してまとめました。
第一章では、RAGとは何かを改めて整理しています。RAGの基本的な仕組みや特徴を説明し、なぜRAGが必要とされるのか、そしてなぜ高精度化が重要なのかについて触れています。
第二章では、RAGを評価するための方法について解説しています。RAGを使うにあたって「精度がどの程度出ているのか」を正しく測定することは非常に重要です。本章では、精度をどう測るべきか、また評価の際に押さえておくべき考え方などを紹介しています。
そして第三章が本書のメインパートで、全体の約6〜7割を占めています。ここではRAGの精度を改善するための実践的なアプローチを大きく三つに分けて解説しています。まずは前処理の工夫(PDFやExcelからの情報抽出、データの整理、チャンク分割やサイズ設定など)、次に検索精度の改善(例えばRerank手法やParent Page Retrievalなど、より関連性の高い情報を取り出す方法)、そして生成精度の改善(Agentic RAGをはじめ、検索結果をどう活かしてより良い回答を生成する方法など)です。さらに本文の合間にはいくつかのコラムも挟んでおり、その中では例えばDeepResearchやその改善手法といったテーマも取り上げ、より発展的なアプローチについても紹介しています。
全体を通して、紹介している方法はすべて論文やオープンソースを根拠にしており、加えて私自身が実際に試した経験を踏まえて「本当に使える」と思ったものを中心に整理していますので、実務の参考になる内容になっていると思います。
具体的な目次は以下の通りです:
ちなみに Kindle Unlimited会員の方は無料でお読みいただけます。
興味のある方はこちらからどうぞ: