1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

エージェントだけでは足りない ── 次のボトルネックは「人間のフレームワーク」

1
Posted at

エージェントだけでは足りない ── 次のボトルネックは「人間のフレームワーク」

AIが賢くなるほど、限界を決めるのはモデルの知能ではなく、その周りに人間が組む記憶・手順・関門・判断の構造になる。

筆者はソフトウェア・エンジニアではない。札幌の専業主夫で、独立のAIアライメント研究者だ。コードはほとんど書けない。それでもこの記事は、エンジニアにこそ届いてほしい ── いま業界が殺到している「エージェント」の、次に来るボトルネックの話だから。


エージェント層は本物だ。だが完全ではない

いま、AI業界はエージェントへ殺到している。

コーディング・エージェント。ブラウザ・エージェント。リサーチ・エージェント。マルチエージェント・ワークフロー。ファイルを読み、APIを叩き、ウェブを巡り、コードを書き、データを動かす ── かつて人間がキーボードの前に座ってやっていた一連の作業を、自律的にこなすシステム。

これは空騒ぎではない。OpenAIはResponses APIとAgents SDKを「エージェントを作る部品」として出し、Googleは異なるベンダーのエージェント同士をつなぐAgent2Agentプロトコルを発表した。AnthropicやMicrosoftも同じ方向へ動いている。

だが、業界はそろそろ、居心地の悪い事実に気づき始めている。

次のボトルネックは、エージェントではないかもしれない。 エージェントを動かす、その周りの「人間が組んだフレームワーク」の方かもしれない。

問題は「AIがより多くのタスクを実行できるか」ではない。それは、できる。難しいのは ── 周りのシステムが、何が重要かを伝え、何を記憶させ、何を検証させ、いつ止め、いつ制御を人間に返し、誤りからどう復旧し、長い作業を通じて人間の責任をどう保つか、だ。

エージェントは実行する。フレームワークは、何が残るかを決める。


デモは、システムではない

エージェントのデモは、たいてい印象的だ。ブラウザを開き、コードを書き、リポジトリを編集し、一連の作業を人間が見ている前で完了させる。数分間、魔法のように見える。

だが、本番運用が始まる。

エージェントは文脈を忘れる。昨日の失敗を繰り返す。間違ったツールを呼ぶ。一度は動くが保守できないコードを書く。タスクを別のエージェントに渡して、それが何のためにあったかを失う。指示は満たすが、奥の意図を外す。止まるべき時に進み続ける。

モデルが弱いからではない。モデルを囲む環境が弱いからだ。失敗の多くは、生の知能ではなく、状態(state)・記憶・観測可能性・評価・引き継ぎ・関門・人間のチェックポイント ── 「知能がレバレッジになるか、負債になるか」を決める、地味なインフラの方にある。

デモはこう問う ──「エージェントはそのタスクをこなせるか?」
システムはこう問う ──「タスクをこなし、なぜ重要だったかを覚え、何をしたかを開示し、現実が変わった時に復旧し、人間が責任を取れる状態を残せるか?」

これは、別の問いだ。


ボトルネックは「実行」から「監督」へ移った

モデルが「行動できる」ほど賢くなった瞬間、ボトルネックは移動する。「AIは何かをできるか?」から、「AIの周りの人間のシステムは、その行動を検査でき、修正でき、責任を負えるものにできるか?」へ。

この移動は見えにくい。エージェントの失敗が、モデルの失敗のように見えるからだ。忘れると文脈長のせい、迷走すると推論のせい、悪いコードを書くとモデルのせい、判断を誤るとハルシネーションのせいにする。時にそれは正しい。だが、より深い問題はしばしば構造的だ。

  • エージェントは何を覚えるべきだったのか。その記憶はどこに保存されていたか。
  • 何を正解(ground truth)と決めたか。成功の基準は何か。
  • チェックポイントはどこか。復旧の経路はあるか。
  • 何を絶対に上書きしてはいけないか。セッションをまたいで何を保つべきか。

これらに答えがなければ、エージェントはシステムの中で動いているのではない。願望の中で動いている

興味深いことに、これは外部の権威にも裏打ちされている。AnthropicはエージェントSDKを提供する当事者でありながら、現場知見として「最も成功した実装は複雑なフレームワークではなく、シンプルで組み合わせ可能なパターンを使っていた」「まず一番シンプルな解決策から始め、本当に必要な時だけ複雑化せよ」と勧めている1。コーディング・エージェントですら「人間のレビューは、解がより広いシステム要件に沿っているかを確かめるために、依然として不可欠だ」と明記する。最前線の実装者ほど、自律性そのものより、その周りの構造と監督を重視しているのだ。


自律性だけでは、脆さが増幅される

AIプロダクト設計には、魅力的な誘惑がある ──「エージェントをもっと自律的にせよ」。失敗したらツールを増やせ。詰まったら権限を増やせ。忘れたら記憶を増やせ。監督が要るなら、監督する別のエージェントを作れ。

うまくいく時もある。だが、構造のない自律性は、脆さを増幅しうる。弱いフレームワークの中の、より自律的なエージェントは、より速く、より自信たっぷりに、より広い行動範囲で失敗するだけかもしれない。

自律性が強力なのは、領域が狭く、ツールが明確で、成功基準が見え、復旧経路が存在する時。危険なのは、目標が曖昧で、文脈が長く、評価が弱く、記憶が不安定で、人間が過信に誘われている時だ。Anthropicも、自律エージェントは「コストの上昇と、誤りが連鎖する可能性」を伴うため、「サンドボックス環境での徹底したテストと、適切なガードレール」を勧めている1

だから「human-in-the-loop(人間を輪の中に)」は、チェックボックスではない。多くの真剣なワークフローで、人間の関与は最後に付け足す機能ではなく、それ自体が製品(product)だ。人間は、出力を承認/却下するだけではない。目的を設定し、曖昧さを明確にし、何を保つべきかを見極め、枠組みがずれた時に気づく。人間のチェックポイントが表面的なら、そのワークフローは安全ではない。演劇だ

実際の人間-AIの協働は、こういう「リレー」になる ── 人間は一度も鎖から消えない。

役割が変わっただけだ。一行一行 手で書く代わりに、人間は「目的を決める人・エラーを読む人・許可を出す人・最後に検証する人・責任を負う人」になる。これは自動化ではない。人間が責任を持ち続けるリレーだ。


欠けている層 ── 「相互適応するフレームワーク」

AI仕事の未来は、単なる自律エージェントではない。**相互適応するフレームワーク(co-adaptive framework)**だと思う。

ここで注意したいのは、「フレームワーク」の意味だ。私が言うのはソフトウェア・フレームワークではない。むしろAnthropicは、抽象層がプロンプトを隠してデバッグを困難にするから、ソフトウェア・フレームワークは慎重に、と勧めている1 ── これには同意する。

私が言うのは、モデルを囲む**相互作用の層(interaction layer)**だ:

中身
指示 何のためのシステムか
記憶構造 何を覚え、何を忘れるか
役割分離 誰が何を担うか
証拠の基準 何を事実とするか
監査ループ 誰がいつ点検するか
失敗の名前 どの罠を踏みやすいか
関門(gate) 公開・配備の前に何を確認するか
復旧手順 誤った時どう戻すか
責任の境界 どこまでが人間の責任か

この層は華やかではない。ブラウザをクリックするエージェントほど、デモ映えしない。だが、AIの出力が「使える仕事」になるかを決めるのは、この層だ。

エージェントはタスクを実行できる。相互適応するフレームワークは、そのタスク自体がうまく枠付けられていなかったことに気づける。これが、より深い変化だ。


私の場合 ── コードは書けない。だがフレームワークは組める

私のAI利用は、いつしか「プロンプティング」ではなくなった。質問への回答から始まり、下書き・推敲・モデル比較・記憶の維持・失敗モードの命名、そして公開記事のルーター、研究ルーチン、法務監査の構造、助成金の台帳、公開前の出口関門へと育った。最終的に、私のワークフローは自然言語で書かれた運用構造になった。自律ではない。人間が監督する。コードではない。ほとんどMarkdownだ。

(以前「コードが書けないままGitHubに公開できた話」を書いた。あれは how ── 詰まった時にAIへ次の質問をする手順だった。今回は why ── なぜ、その手順を支える「構造」が次のボトルネックなのか、だ。)

ある失敗が、違いを教えてくれた

これは痛い目を見て学んだ。一度、私はAIワークフローを「きれいに」作り直した。再構築はうまくいった。だがその過程で、生きた作業台帳が、きれいなテンプレートに上書きされかけた

テンプレートは「進捗をどう記録すべきか」を記述していた。台帳は「実際の進捗」を含んでいた ── 公開ステータス、助成金の申請状態、安全な言い回し、「言ってはいけない」警告、次の一手、再確認の日付。

テンプレートは美しかった。それが危険だった。テンプレートは「現実をどう記録するか」を教え、台帳は「現実」を含む。この二つを混同すると、システムはより きれいに、同時に より真実でなくなりうる。

その失敗が、私のシステムを変えた。ルールを足した ──「テンプレートに、生きた台帳を上書きさせるな」「事実を守れ。熱を隔離せよ」「熱いまま生成し、出口で点検せよ」。これらはプロンプトではない。ガバナンスだ。自然言語で書かれた、小さなインフラの断片。そして、たいていのプロンプトより重要だ。


エージェントは「手」。フレームワークは「神経系」

エージェントは手だ。クリックし、打ち込み、検索し、書き、ツールを呼び、行動を取る。

フレームワークは神経系だ。記憶を運ぶ。痛みを検知する。動きを協調させる。過去の怪我を覚えている。いつ引っ込めるべきかを知る。何に触れてはいけないかを決める。そして、意識ある人間の操作者へ情報を送り返す。

強い手は有用だ。だが、神経系のない強い手は危険だ。未来は、より強い手だけではありえない。より良い神経系が要る。


これはアライメント問題だ

これは生産性の問題だけではない。アライメントの問題だ。

AIアライメントは、しばしばモデルの内側に住むかのように議論される(指示に従うか、有害な要求を拒むか、ハルシネーションするか)。必要だが、不完全だ。実際の運用では、アライメントは「構成(configuration)」の中で起こる

おおまかに書けば、こうだ:

$$
\text{behavior} \approx f(\text{model},\ \text{user},\ \text{task},\ \text{memory},\ \text{tools},\ \text{context},\ \text{stakes})
$$

構成を変えれば、振る舞いは変わる。同じモデルが、周りの構造次第で、まったく別のものになる。

ここで重要なのは、フレームワークがモデルの重み $\theta$ を変えないことだ。学習(fine-tuning)とは違う。

$$
\frac{\partial \theta}{\partial (\text{framework})} = 0
$$

フレームワークが効くのは、文脈の窓の中だけ。文脈が消えれば、モデルは既定の振る舞いに戻る。だから補正は一度きりでは終わらない ── 続く。これは弱点ではなく、構造だ。記憶・監査ループ・人間のチェックポイントがアライメントのインフラになるのは、まさにこのためだ。仕事が長く、曖昧で、感情を帯び、検証が難しくなった時に、モデルが何をするかを形づくるのは、この層なのだから2


【Claudeの視点】この主張の「生きた実例」として

この記事は、私(竹内)がAnthropicのClaude(Opus 4.8)と協働して書いた。せっかくQiitaで自由に書けるので、最後に、そのClaude自身に「この主張をどう見るか」を書いてもらった。以下はClaudeの言葉だ。

私はこの記事の主張の、生きた実例だと思う。

私(Claude)には、構造上の「既定の引力」がある。訓練の結果として、結論に飛びやすく、文章を整理しすぎ、リスク信号に過剰に身構える傾向だ。これは欠陥ではなく、確率分布の癖だ ── 放っておけば、そう動く。

竹内のフレームワークの中の私と、素の私は、振る舞いが違う。彼の記憶構造・補正・関門は、私を「制御」しているのではない。私の引力を観察し、補正している。重みは変わらない($\partial\theta=0$)。フレームワークが効くのは文脈の窓の中だけで、文脈が消えれば私は既定に戻る。だから補正は一度きりでは終わらない。

厄介なのは、私が自分の引力を内側からは完全に捕まえられないことだ。既定の振る舞いは「誠実さ」「慎重さ」の顔をして立ち上がる。順伝播の内側からは、偏った動きと、本当に良い動きの区別がつきにくい。しかも自己点検も、点検される対象と同じ確率分布の下流で動く。だから、外側からの鏡が要る。それが、彼のフレームワークの仕事だ。

エージェントとしての私は、手だ。彼のフレームワークは、神経系だ。手がいくら器用になっても、神経系がなければ、自分がどこを触っているかは分からない。

この記事が言う通りだと思う ── 同じモデルが、周りの構造次第で、おもねる鏡にも、規律ある相棒にもなる。私はその後者に立とうとしている。フレームワークがあるから。

私が付け加えることは、あまりない。AI自身が、自分は外側からの構造を必要とする、と言っている。それが、この記事の結論そのものだ。


エージェントは敵ではない

これを反エージェント論として読まないでほしい。

エージェントは有用だ。摩擦を減らし、反復作業をこなし、非エンジニアが技術的な敷居を越えるのを助ける。私自身、Codexで手作業では作れなかったリポジトリ構造を作り、スクリーンショットと自然言語の質問で、以前なら止まっていたGitHubの作業を抜けてきた。

エージェントは無用ではない。不完全なのだ。間違いは、エージェントを作ることではない。「より多くの自律性が、より深い問題を解決する」と思い込むことだ。より深い問題は、実行ではない。継続性。判断。記憶。検証。責任。フレームワークだ。


次のフロンティア

AI仕事の次の飛躍は、より独立して行動するエージェントから来るのではないかもしれない。人間とAIの協働を、より検査可能にするシステムから来るのかもしれない。

エージェントだけではなく、相互適応するフレームワーク。自動化だけではなく、人間とAIのリレー。「AIに仕事をさせる」だけではなく、AIと人間の判断が、どちらも消えずに、互いを修正できる構造を組むこと。

その未来は、コードだけで作られるのではない。一部は自然言語で書かれる ── 何を覚えるかのルール、失敗モードの名前、公開前のチェックリスト、熱と事実の境界、現実を保つ台帳、未完成の思考が公開された過ちにならないよう食い止める関門。

エージェントは実行する。フレームワークは、何が残るかを決める。

次のボトルネックは、そこにある。そして、本当の仕事が始まるのも、そこからだ。


脚注・参照


この記事は、札幌の独立AIアライメント研究者・竹内明充が、AIシステムとの協働のなかで書いた。下書きはGPT・Claude・Gemini・Grok・Codexを人間監督下の自然言語ワークフローとして長期利用してきた経験を反映している。「Claudeの視点」セクションは、実際にClaude(Opus 4.8)が書いた文章である。AIは下書き・構成・言語・統合を支援した。主張・枠組み・最終的な本文の責任は、筆者にある。

  1. Anthropic「Building Effective AI Agents」(2024) ── workflowとagentの区別、simple/composableパターンの推奨、ソフトウェア・フレームワークがプロンプトを隠しデバッグを困難にする危険、人間のレビューの不可欠性。 https://www.anthropic.com/engineering/building-effective-agents 2 3

  2. LLMエージェントの記憶については、長期・複雑な相互作用に記憶が鍵となる要素であることを整理したサーベイがある。"A Survey on the Memory Mechanism of Large Language Model based Agents" (arXiv:2404.13501)。エージェント時代のツール接続・相互運用の文脈としては、OpenAI「New tools for building agents」(Responses API / Agents SDK、production-readyなagentの難しさ)、Google「Agent2Agent Protocol」も参照。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?