はじめに
2025年7月に発売された「現場で活用するためのAIエージェント実践入門」を読み始めました。発売と同時に品薄になり、なんと一時期フリマサービスで高額取引されていたという伝説の技術書です。
発売直後に入手していたのですが、転職したばかりでなかなか本を読むペースが作れず、最近やっと落ち着いてきたので読み始めました。
約300ページなので、半年前くらいに読んだ「LangChainとLangGraphによるRAG・AIエージェント[実践]入門」よりは薄いのですが、難易度はちょっと高そうです。そこで、今回も1Qiitaの力を借りることにしました。章ごとにメモを投稿しつつ読破を目指しますので、「いいね」や「ストック」でパワーをください![]()
この記事は個人で作成したものであり、内容や意見は所属企業を代表するものではありません。
(この本の)はじめに
「対象読者(前提知識)」として、LLMのAPIを利用した開発経験、LLMのプロンプトエンジニアリングの経験、RAGアルゴリズムの開発経験が挙げられています。ややハードルが高めですね。
もし前提知識を満たせていない方は、先に「LangChainとLangGraphによるRAG・AIエージェント[実践]入門」の第7章までを読んでいただくといいかもしれません。
第1章 AIエージェントの概要
この章ではAIエージェントの概要を学びます。
1.1 AIエージェントとは?
AIエージェントが自律性と知性という2つの観点で説明されていますが、なるほど、確かにわかりやすいです。取り組む課題に応じて重視すべき観点も変わってきます。
1.2 AIエージェントのビジネス状況
AIエージェントに関する直近数年の振り返りですが、たくさんのライブラリやサービスがリリースされているので、とても覚えきれません。また、この感じだと2年もしたらほとんど入れ替わっていそうです。
それにしても、名前がかぶってしまうのは困ったものです。たとえば「Code Interpreter」は「Open AIの話?それともBedrock AgentCoreの話?」ってなりそうですし、「Deep Research」は「Geminiの?Open AIの?」ってなりそうですし、「Agents SDK」も「OpenAI?MS365?」となりそうです。「Operator」も一般的すぎてヤバいですね。なにか覚えやすい名前を付けて欲しいところです。
1.3 AIエージェントの技術的な位置付け
開発の方向性が学習と推論に分けて解説されています。まず推論方式で構築し、価値が判断できればデータを集めて学習方式へ、というのはその通りだと思います。ただ、本にもあるように近い将来「苦い教訓」の話がやってくるでしょう。columnに書かれているエージェント学習(Agent-Tuning)の話も非常に興味深いです。
そういえば最近、DSPyというプロンプトを自動調整する仕組みが注目されています。プロンプトの指示やfew shotの例を調整してくれます。
これは推論時の調整をするものだと思っていたのですが、ドキュメントを見たらファインチューニングの話もありました。
この感じだと、せっかく推論方式のAIエージェントを作れるようになっても、数年で学習方式が主流になってしまうかも。AI関連の技術は学んだことがすぐに陳腐化してしまうのが辛いですね。
1.4 AIエージェント開発の選択肢
プロダクトを作る場合はフルスクラッチ相当を推奨というのは、ホントそうだと思います。ブラックボックスになっていて手が出せない状態では運用ができません。
私もLLMを使ったプロダクトのカスタマーサクセスを担当していたことがありましたが、LLMの進化が早いので調整作業が頻繁に発生します。きちんと中に手を出せる状態で作っておかないと、調整できずにすぐに詰んでしまうのです。ちょっと古いですが、調整の大変さをグチっていた資料があるので貼り付けておきます。
1.5 まとめ
第1章はつまずかずに終えられました。次回はAIエージェントの構成要素の話へと進みます。
(このメモのほかの章へ:1章 / 2章 / 3章 / 4章 / 5章 / 6章 / 7章 / 8章 / 9章 / 10章 / まとめ)
-
Qiitaの力を借りてやり切ったもの(Qiitaに投稿することでやらざるを得なくなって終わらせることができたもの😅):
言語処理100本ノック 2020
ゼロから作るDeep LearningーーPythonで学ぶディープラーニングの理論と実装
ゼロから作るDeep Learning❷ーー自然言語処理編
LangChainとLangGraphによるRAG・AIエージェント[実践]入門 ↩