Chapter1 MCPとは
MCPの概要
- Model Context Protocolの略
- LLM Claudeの開発企業Anthropic社が2024年11月に発表
- LLMにコンテキスト情報を提供する方法の標準化を目的に策定
- コンテキストとはLLMが推論を行う際にユーザー入力以外で必要となる補足情報の意
- 仕様の定義だけでなくSDKも同時に公開されてたことで急速に普及
- 2025年には競合他社での採用も増え、デファクトスタンダードとなりつつある
コンテキスト情報をの受け渡し方を標準化するために策定されたという点で重要。従来はAIアプリにおいて用いるツールやフレームワーク毎に実装がことなり、各々の仕様に合わせて実装する必要が有ったが、MCPに則ってアプリを実装することでツールやフレームワーク毎の違いを意識せずに実装が可能となる。
AIエージェント
- AIエージェントの特徴は以下の4つ
- プロファイル
役割を定義したり、パーソナライズ可能 - 記憶
長期間にわたる出来事の記憶を上手く保持可能 - 計画
与えられた目的を達成するための行動計画を立て、各タスクの実行後、その結果を受けて計画を修正可能 - 行動
LLMが事前学習済みの知識に基づいて推論を実行したり、ツールを実行して環境の内外に働きかけることが可能
- プロファイル
- 特に重要なのが計画と行動
- 具体的なアプローチの1つにReAct(Reasoning and Acting)
- AIエージェントが人間の指示に対応する時に計画→行動→観察のプロセスを繰り返し、臨機応変に軌道修正し、目的を達成する
Function calling
後日追記
ユースケース
著者がKDDIの方なのでKDDIの事例が掲載されていた
- Web会議の録画データをアップロードするだけで議事録を作成
- 次回の商談に向けた提案書のドラフトを作成
- 人間に代わってAIが資料レビュー
- 実在のレビュー者の口調や性格、ビジネスマインドが再現される様にパーソナライズ
- 裏で様々な情報を検索してレビューの質を高めている
MCPが解決する課題
- AIアプリ開発者目線での課題
- ツールやフレームワーク毎の実装修正が不要
- ツール開発者目線での課題
- MCPに準拠した実装にしておけば開発したツールを他の人に使ってもらえる可能性が高まる
普及の経緯
- 2024年11月 Anthropic社によってMCPが策定、発表される
- 2025年3月 OpenAI社がAgents SDKでMCPをサポートした。その後、OpenAI APIやChatGPTアプリでも対応方針のアナウンスが出される
- 2025年4月 Google DeepMind者がGeminiやSDKにおいて対応を表明
- AIコーディングツールにおいても早くから採用される
RAGとの違い
後日追記
Function callingとの違い
後日追記
グラウンディングとの違い
後日追記