一、Agentとは何か?まずは公式を整理してみよう
多くの人がAgentと聞くと混乱してしまいます。実は、概念的には最も基本的な構成要素はシンプルです:
Agent = LLM + Tools。つまり、大規模言語モデルにツールを持たせれば、何でもできるようになるということです。
ただし、現実はこの公式よりも複雑です。現在のAgentは以下のように分解できます:Agent = LLM + Agentフレームワーク + Prompts + Tools。それぞれのパーツに欠かせない役割があります:
LLMはCPUに相当する
計算のコアとして推論と意思決定を担います。将来的には数社の大手に集約されていくでしょう。今日のIntelやAMDのように。
Agentフレームワークはオペレーティングシステムに相当する
Claude CodeやCodeXなどが現在の主流です。リソースの呼び出しやタスク管理を担当することで、一般ユーザーでも迷わず使えるようになっています。
Promptはコマンドラインに相当する
直接指示を入力してシステムと対話します。
Toolsは拡張機能である
Agentの実行可能範囲を広げ、能力を拡張します。MCPは本命視されていましたが、実際には統一インターフェース規格に過ぎず、使用ロジックの課題は解決していません。
従来のAgentは、まるで誰もが原始的なOSで一行ずつコマンドを打ち込んでいるようなもので、効率が悪く、ハードルが高く、再現性にも乏しいものでした。2024年末、AnthropicがSkillsを発表したことで、Agentはついに独自のアプリケーションエコシステムを持つようになりました。公式が完成したのです:Agent = LLM + Agentフレームワーク + Skills。
二、MCPが定着しなかった理由
昨年、MCPは大きな注目を集めましたが、すぐに熱が冷めてしまいました。
原因は非常にシンプルです:MCPは「ツールの接続」という問題は解決しましたが、「ツールの使い方」という問題は解決していませんでした。
たとえ話をしましょう。あなたが高品質な楽器一式を購入したとします。部品は充実していて、インターフェースも標準化されています。しかし、取扱説明書がなければ、どの楽器から始めればいいのか、どう組み合わせればいいのか、どうすれば最高の演奏ができるのかわかりません。
MCPは「部品の統一とインターフェース標準化」を実現しましたが、開発者はPromptで手動で指示を書く必要がありました:
「まずAツールを使って結果を取得し、次にBツールで処理する」
これでは完全に重複作業です。
MCPの問題点は、これが体力勝負であって、エコシステムではないということです。
真のアプリケーションエコシステムとは、「拾って即使える」ものです。
ユーザーは「この機能を実現したい」と言うだけで、AIがすべて対応できるのです。
三、Skillsの真価はどこにあるのか?
Skillsは、AIが使う「アプリ」として理解できます。タスクを完了するための全体的なフローがパッケージ化されています:
使用するツール
- どの順序で呼び出すか
- 各ステップでどのようにプロンプトを提示するか
- エラーにどう対処するか
これらの経験値がすべてSkillに封じ込められており、手動で調整する必要はありません。
具体例:競合製品分析を行いたい場合
Skillsがない場合:
自分でプロンプトを書き、LLMにウェブサイトをクロールさせ、情報を抽出し、比較表を生成させる必要があります。
Skillsを使用する場合:
「競合製品分析Skill」を直接呼び出し、競合製品名を入力するだけで、すぐに結果が出ます。経験を積めば、知識として共有できます。
これがSkillsの核心的価値です
Agentを「毎回手作業で調整する」ものから「直接インストールして使用できるアプリケーション」に変え、効率が飛躍的に向上し、参入障壁が大幅に下がります。
四、Skills vs Workflow、違いはあるのか?
多くの人が混同しやすいのですが、WorkflowとSkillsは実際には大きく異なります:
Workflowは硬直的
ロジックが固定されており、第1ステップで何をして、第2ステップで何をするか、分岐があっても事前に設定されたルートに従うしかなく、柔軟性に欠けます。
Skillsは柔軟
**Progressive Disclosure(段階的開示原則)**を採用しています。人間がタスクを開始する際、まず決まるのは「それをやるかどうか」です。各Skillには簡潔な紹介文書(GitHubのREADMEに似ています)があり、LLMに「私は何ができるのか」を伝えます。
タスクを実行する際、LLMはまず簡潔に判断し、どのSkillが使えそうか確認してから、詳細を読み込みます。
メリット1: リソース消費が少なく、すべてのSkill内容を上下文に詰め込む必要がない
メリット2: Skillを組み合わせることができ、LLMは複数のSkillを同時に参照し、呼び出し順序を決定できる
メリット3: 元のWorkflowもSkillにパッケージ化でき、随時呼び出して、真にアプリケーション化を実現
まとめ
Skillsの登場により、AIエージェントは新たな段階に入りました。これは単なる技術的な進化ではなく、使い方のパラダイムシフトです。MCPがインフラを整備したのに対し、Skillsはその上に実用的なエコシステムを構築しました。
今後、AgentとSkillsの組み合わせがスタンダードになっていくでしょう。ユーザーはもはや複雑なPromptを書く必要がなく、必要なSkillを選んで、やりたいことを伝えるだけで、AIがすべてを処理してくれるのです。