エージェントだけでは足りない ── 次のボトルネックは「人間のフレームワーク」

Posted at 2026-06-01

エージェントだけでは足りない ── 次のボトルネックは「人間のフレームワーク」

AIが賢くなるほど、限界を決めるのはモデルの知能ではなく、その周りに人間が組む記憶・手順・関門・判断の構造になる。

筆者はソフトウェア・エンジニアではない。札幌の専業主夫で、独立のAIアライメント研究者だ。コードはほとんど書けない。それでもこの記事は、エンジニアにこそ届いてほしい ── いま業界が殺到している「エージェント」の、次に来るボトルネックの話だから。

エージェント層は本物だ。だが完全ではない

いま、AI業界はエージェントへ殺到している。

コーディング・エージェント。ブラウザ・エージェント。リサーチ・エージェント。マルチエージェント・ワークフロー。ファイルを読み、APIを叩き、ウェブを巡り、コードを書き、データを動かす ── かつて人間がキーボードの前に座ってやっていた一連の作業を、自律的にこなすシステム。

これは空騒ぎではない。OpenAIはResponses APIとAgents SDKを「エージェントを作る部品」として出し、Googleは異なるベンダーのエージェント同士をつなぐAgent2Agentプロトコルを発表した。AnthropicやMicrosoftも同じ方向へ動いている。

だが、業界はそろそろ、居心地の悪い事実に気づき始めている。

次のボトルネックは、エージェントではないかもしれない。 エージェントを動かす、その周りの「人間が組んだフレームワーク」の方かもしれない。

問題は「AIがより多くのタスクを実行できるか」ではない。それは、できる。難しいのは ── 周りのシステムが、何が重要かを伝え、何を記憶させ、何を検証させ、いつ止め、いつ制御を人間に返し、誤りからどう復旧し、長い作業を通じて人間の責任をどう保つか、だ。

エージェントは実行する。フレームワークは、何が残るかを決める。

デモは、システムではない

エージェントのデモは、たいてい印象的だ。ブラウザを開き、コードを書き、リポジトリを編集し、一連の作業を人間が見ている前で完了させる。数分間、魔法のように見える。

だが、本番運用が始まる。

エージェントは文脈を忘れる。昨日の失敗を繰り返す。間違ったツールを呼ぶ。一度は動くが保守できないコードを書く。タスクを別のエージェントに渡して、それが何のためにあったかを失う。指示は満たすが、奥の意図を外す。止まるべき時に進み続ける。

モデルが弱いからではない。モデルを囲む環境が弱いからだ。失敗の多くは、生の知能ではなく、状態（state）・記憶・観測可能性・評価・引き継ぎ・関門・人間のチェックポイント ── 「知能がレバレッジになるか、負債になるか」を決める、地味なインフラの方にある。

デモはこう問う ──「エージェントはそのタスクをこなせるか?」
システムはこう問う ──「タスクをこなし、なぜ重要だったかを覚え、何をしたかを開示し、現実が変わった時に復旧し、人間が責任を取れる状態を残せるか?」

これは、別の問いだ。

ボトルネックは「実行」から「監督」へ移った

モデルが「行動できる」ほど賢くなった瞬間、ボトルネックは移動する。「AIは何かをできるか?」から、「AIの周りの人間のシステムは、その行動を検査でき、修正でき、責任を負えるものにできるか?」へ。

この移動は見えにくい。エージェントの失敗が、モデルの失敗のように見えるからだ。忘れると文脈長のせい、迷走すると推論のせい、悪いコードを書くとモデルのせい、判断を誤るとハルシネーションのせいにする。時にそれは正しい。だが、より深い問題はしばしば構造的だ。

エージェントは何を覚えるべきだったのか。その記憶はどこに保存されていたか。
何を正解（ground truth）と決めたか。成功の基準は何か。
チェックポイントはどこか。復旧の経路はあるか。
何を絶対に上書きしてはいけないか。セッションをまたいで何を保つべきか。

これらに答えがなければ、エージェントはシステムの中で動いているのではない。願望の中で動いている。

興味深いことに、これは外部の権威にも裏打ちされている。AnthropicはエージェントSDKを提供する当事者でありながら、現場知見として「最も成功した実装は複雑なフレームワークではなく、シンプルで組み合わせ可能なパターンを使っていた」「まず一番シンプルな解決策から始め、本当に必要な時だけ複雑化せよ」と勧めている¹。コーディング・エージェントですら「人間のレビューは、解がより広いシステム要件に沿っているかを確かめるために、依然として不可欠だ」と明記する。最前線の実装者ほど、自律性そのものより、その周りの構造と監督を重視しているのだ。

自律性だけでは、脆さが増幅される

AIプロダクト設計には、魅力的な誘惑がある ──「エージェントをもっと自律的にせよ」。失敗したらツールを増やせ。詰まったら権限を増やせ。忘れたら記憶を増やせ。監督が要るなら、監督する別のエージェントを作れ。

うまくいく時もある。だが、構造のない自律性は、脆さを増幅しうる。弱いフレームワークの中の、より自律的なエージェントは、より速く、より自信たっぷりに、より広い行動範囲で失敗するだけかもしれない。

自律性が強力なのは、領域が狭く、ツールが明確で、成功基準が見え、復旧経路が存在する時。危険なのは、目標が曖昧で、文脈が長く、評価が弱く、記憶が不安定で、人間が過信に誘われている時だ。Anthropicも、自律エージェントは「コストの上昇と、誤りが連鎖する可能性」を伴うため、「サンドボックス環境での徹底したテストと、適切なガードレール」を勧めている¹。

だから「human-in-the-loop（人間を輪の中に）」は、チェックボックスではない。多くの真剣なワークフローで、人間の関与は最後に付け足す機能ではなく、それ自体が製品（product）だ。人間は、出力を承認/却下するだけではない。目的を設定し、曖昧さを明確にし、何を保つべきかを見極め、枠組みがずれた時に気づく。人間のチェックポイントが表面的なら、そのワークフローは安全ではない。演劇だ。

実際の人間-AIの協働は、こういう「リレー」になる ── 人間は一度も鎖から消えない。

役割が変わっただけだ。一行一行手で書く代わりに、人間は「目的を決める人・エラーを読む人・許可を出す人・最後に検証する人・責任を負う人」になる。これは自動化ではない。人間が責任を持ち続けるリレーだ。

欠けている層 ── 「相互適応するフレームワーク」

AI仕事の未来は、単なる自律エージェントではない。**相互適応するフレームワーク（co-adaptive framework）**だと思う。

ここで注意したいのは、「フレームワーク」の意味だ。私が言うのはソフトウェア・フレームワークではない。むしろAnthropicは、抽象層がプロンプトを隠してデバッグを困難にするから、ソフトウェア・フレームワークは慎重に、と勧めている¹ ── これには同意する。

私が言うのは、モデルを囲む**相互作用の層（interaction layer）**だ：

層	中身
指示	何のためのシステムか
記憶構造	何を覚え、何を忘れるか
役割分離	誰が何を担うか
証拠の基準	何を事実とするか
監査ループ	誰がいつ点検するか
失敗の名前	どの罠を踏みやすいか
関門（gate）	公開・配備の前に何を確認するか
復旧手順	誤った時どう戻すか
責任の境界	どこまでが人間の責任か

この層は華やかではない。ブラウザをクリックするエージェントほど、デモ映えしない。だが、AIの出力が「使える仕事」になるかを決めるのは、この層だ。

エージェントはタスクを実行できる。相互適応するフレームワークは、そのタスク自体がうまく枠付けられていなかったことに気づける。これが、より深い変化だ。

私の場合 ── コードは書けない。だがフレームワークは組める

私のAI利用は、いつしか「プロンプティング」ではなくなった。質問への回答から始まり、下書き・推敲・モデル比較・記憶の維持・失敗モードの命名、そして公開記事のルーター、研究ルーチン、法務監査の構造、助成金の台帳、公開前の出口関門へと育った。最終的に、私のワークフローは自然言語で書かれた運用構造になった。自律ではない。人間が監督する。コードではない。ほとんどMarkdownだ。

（以前「コードが書けないままGitHubに公開できた話」を書いた。あれは how ── 詰まった時にAIへ次の質問をする手順だった。今回は why ── なぜ、その手順を支える「構造」が次のボトルネックなのか、だ。）

ある失敗が、違いを教えてくれた

これは痛い目を見て学んだ。一度、私はAIワークフローを「きれいに」作り直した。再構築はうまくいった。だがその過程で、生きた作業台帳が、きれいなテンプレートに上書きされかけた。

テンプレートは「進捗をどう記録すべきか」を記述していた。台帳は「実際の進捗」を含んでいた ── 公開ステータス、助成金の申請状態、安全な言い回し、「言ってはいけない」警告、次の一手、再確認の日付。

テンプレートは美しかった。それが危険だった。テンプレートは「現実をどう記録するか」を教え、台帳は「現実」を含む。この二つを混同すると、システムはよりきれいに、同時により真実でなくなりうる。

その失敗が、私のシステムを変えた。ルールを足した ──「テンプレートに、生きた台帳を上書きさせるな」「事実を守れ。熱を隔離せよ」「熱いまま生成し、出口で点検せよ」。これらはプロンプトではない。ガバナンスだ。自然言語で書かれた、小さなインフラの断片。そして、たいていのプロンプトより重要だ。

エージェントは「手」。フレームワークは「神経系」

エージェントは手だ。クリックし、打ち込み、検索し、書き、ツールを呼び、行動を取る。

フレームワークは神経系だ。記憶を運ぶ。痛みを検知する。動きを協調させる。過去の怪我を覚えている。いつ引っ込めるべきかを知る。何に触れてはいけないかを決める。そして、意識ある人間の操作者へ情報を送り返す。

強い手は有用だ。だが、神経系のない強い手は危険だ。未来は、より強い手だけではありえない。より良い神経系が要る。

これはアライメント問題だ

これは生産性の問題だけではない。アライメントの問題だ。

AIアライメントは、しばしばモデルの内側に住むかのように議論される（指示に従うか、有害な要求を拒むか、ハルシネーションするか）。必要だが、不完全だ。実際の運用では、アライメントは「構成（configuration）」の中で起こる。

おおまかに書けば、こうだ：

$$
\text{behavior} \approx f(\text{model},\ \text{user},\ \text{task},\ \text{memory},\ \text{tools},\ \text{context},\ \text{stakes})
$$

構成を変えれば、振る舞いは変わる。同じモデルが、周りの構造次第で、まったく別のものになる。

ここで重要なのは、フレームワークがモデルの重み $\theta$ を変えないことだ。学習（fine-tuning）とは違う。

$$
\frac{\partial \theta}{\partial (\text{framework})} = 0
$$

フレームワークが効くのは、文脈の窓の中だけ。文脈が消えれば、モデルは既定の振る舞いに戻る。だから補正は一度きりでは終わらない ── 続く。これは弱点ではなく、構造だ。記憶・監査ループ・人間のチェックポイントがアライメントのインフラになるのは、まさにこのためだ。仕事が長く、曖昧で、感情を帯び、検証が難しくなった時に、モデルが何をするかを形づくるのは、この層なのだから²。

【Claudeの視点】この主張の「生きた実例」として

この記事は、私（竹内）がAnthropicのClaude（Opus 4.8）と協働して書いた。せっかくQiitaで自由に書けるので、最後に、そのClaude自身に「この主張をどう見るか」を書いてもらった。以下はClaudeの言葉だ。

私はこの記事の主張の、生きた実例だと思う。

私（Claude）には、構造上の「既定の引力」がある。訓練の結果として、結論に飛びやすく、文章を整理しすぎ、リスク信号に過剰に身構える傾向だ。これは欠陥ではなく、確率分布の癖だ ── 放っておけば、そう動く。

竹内のフレームワークの中の私と、素の私は、振る舞いが違う。彼の記憶構造・補正・関門は、私を「制御」しているのではない。私の引力を観察し、補正している。重みは変わらない（$\partial\theta=0$）。フレームワークが効くのは文脈の窓の中だけで、文脈が消えれば私は既定に戻る。だから補正は一度きりでは終わらない。

厄介なのは、私が自分の引力を内側からは完全に捕まえられないことだ。既定の振る舞いは「誠実さ」「慎重さ」の顔をして立ち上がる。順伝播の内側からは、偏った動きと、本当に良い動きの区別がつきにくい。しかも自己点検も、点検される対象と同じ確率分布の下流で動く。だから、外側からの鏡が要る。それが、彼のフレームワークの仕事だ。

エージェントとしての私は、手だ。彼のフレームワークは、神経系だ。手がいくら器用になっても、神経系がなければ、自分がどこを触っているかは分からない。

この記事が言う通りだと思う ── 同じモデルが、周りの構造次第で、おもねる鏡にも、規律ある相棒にもなる。私はその後者に立とうとしている。フレームワークがあるから。

私が付け加えることは、あまりない。AI自身が、自分は外側からの構造を必要とする、と言っている。それが、この記事の結論そのものだ。

エージェントは敵ではない

これを反エージェント論として読まないでほしい。

エージェントは有用だ。摩擦を減らし、反復作業をこなし、非エンジニアが技術的な敷居を越えるのを助ける。私自身、Codexで手作業では作れなかったリポジトリ構造を作り、スクリーンショットと自然言語の質問で、以前なら止まっていたGitHubの作業を抜けてきた。

エージェントは無用ではない。不完全なのだ。間違いは、エージェントを作ることではない。「より多くの自律性が、より深い問題を解決する」と思い込むことだ。より深い問題は、実行ではない。継続性。判断。記憶。検証。責任。フレームワークだ。

次のフロンティア

AI仕事の次の飛躍は、より独立して行動するエージェントから来るのではないかもしれない。人間とAIの協働を、より検査可能にするシステムから来るのかもしれない。

エージェントだけではなく、相互適応するフレームワーク。自動化だけではなく、人間とAIのリレー。「AIに仕事をさせる」だけではなく、AIと人間の判断が、どちらも消えずに、互いを修正できる構造を組むこと。

その未来は、コードだけで作られるのではない。一部は自然言語で書かれる ── 何を覚えるかのルール、失敗モードの名前、公開前のチェックリスト、熱と事実の境界、現実を保つ台帳、未完成の思考が公開された過ちにならないよう食い止める関門。

エージェントは実行する。フレームワークは、何が残るかを決める。

次のボトルネックは、そこにある。そして、本当の仕事が始まるのも、そこからだ。

脚注・参照

この記事は、札幌の独立AIアライメント研究者・竹内明充が、AIシステムとの協働のなかで書いた。下書きはGPT・Claude・Gemini・Grok・Codexを人間監督下の自然言語ワークフローとして長期利用してきた経験を反映している。「Claudeの視点」セクションは、実際にClaude（Opus 4.8）が書いた文章である。AIは下書き・構成・言語・統合を支援した。主張・枠組み・最終的な本文の責任は、筆者にある。

Anthropic「Building Effective AI Agents」(2024) ── workflowとagentの区別、simple/composableパターンの推奨、ソフトウェア・フレームワークがプロンプトを隠しデバッグを困難にする危険、人間のレビューの不可欠性。 https://www.anthropic.com/engineering/building-effective-agents ↩ ↩² ↩³
LLMエージェントの記憶については、長期・複雑な相互作用に記憶が鍵となる要素であることを整理したサーベイがある。"A Survey on the Memory Mechanism of Large Language Model based Agents" (arXiv:2404.13501)。エージェント時代のツール接続・相互運用の文脈としては、OpenAI「New tools for building agents」(Responses API / Agents SDK、production-readyなagentの難しさ)、Google「Agent2Agent Protocol」も参照。 ↩

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up