今週、3つの出来事がありました。すべてが同じ物語を語っています。
4月3日、NPRは、AIによる法的制裁が1,200件以上に達し、記録的な11万ドルの罰金が科されたと報じました。裁判所は1日だけで10件の制裁を下しました。4月4日、The Weekは、エンタープライズ環境はいまだにエージェント型AIに対応できていないと報じました。85%の企業が3年以内にAIエージェントを展開したいと考えていますが、76%が自社の業務ではそれを支えられないと認めています。展開されたエージェントの50%は完全な孤立状態で稼働しています。そして今朝、NVIDIAはSalesforce、Adobe、Atlassian、ServiceNowとパートナーシップを結び、オープンエージェントプラットフォームを立ち上げました。ゴールドラッシュはさらに加速しています。
語られるストーリーは魅力的です。AIエージェントがやってくる。作れ、展開しろ、勝て。
しかしデータは別の物語を語っています。問題はエージェント自体ではありません。その下にあるインフラです。誰もがエージェントを作ろうと競い合っています。でも、エージェントを機能させるものを作っている企業は存在しません。
誰も構築しなかったインフラ
エージェントの野心と運用の現実とのギャップは、テクノロジーの問題ではありません。エンジニアリングの問題です。
76%のエンタープライズ企業は、自社のエージェントを運用上サポートできません。 計算リソースが足りないからではありません。モデルの性能が不十分だからでもありません。その下にある基盤を構築していないからです。データは汚れています。プロンプトは検証されていません。スキルは使い捨てです。ガバナンスは形だけです。94%のCIOが、エージェントを展開する前にデータのクリーンアップが必要だと言っています。 データの準備ができていると答えたのは、わずか7%でした。
エージェントを展開するということは、単にモデルを展開することではありません。以下のものを一緒に展開しています:
- エージェントが実行できるスキル(標準化、バージョン管理、テスト済み)
-
- エージェントが使用するプロンプト(スコアリング、検証、文書化済み)
-
- 出力に対するガードレール(バリデーション、承認ワークフロー、ロールバック)
-
- 実際の動作への可視性(ログ、トレース、監査)
これらはほとんどの企業に存在しません。展開されたエージェントの50%が完全な孤立状態で稼働しています——より広いシステムとの統合なし、フィードバックループなし、学習経路なし。
これはエージェントの展開をソフトウェアの展開と同じように扱った場合に起きることです。そうではありません。ソフトウェアにはテストがあります。デプロイメントパイプラインがあります。バージョン管理があります。ロールバック手順があります。
エージェントには全く別のものが必要です:ガバナンスレイヤー。エージェントが安全に実行できること、スキルが機能していること、プロンプトが信頼性の高い出力を生成していること、そしてその推奨に基づいた決定が制裁につながらないことを継続的に検証する仕組みです。
スキル・プロンプト・ガバナンス:失われたレイヤー
現在エンタープライズAIで勝っている企業は、より派手なエージェントを構築しているわけではありません。その下にあるインフラを構築しています。
スキルについて考えてみましょう。スキルとは、エージェントが実行できる個別の能力のことです。それ自体は新しくありません。新しいのは、スキルを標準化し、スコアリングし、共有可能にすることです。Prompeteer.aiとagentskills.ioはこれを実現しています。スキルをSlackの独自インテグレーションから、再利用可能で文書化されたSKILL.mdファイルへと移行しています。CTOは何千もの既製スキルを閲覧し、その機能を正確に把握し、自信を持ってエージェントインフラに統合できるようになりました。
プロンプトについて考えてみましょう。プロンプトはコードです。 バージョン管理が必要です。テストが必要です。品質指標が必要です。Prompeteer.aiのスコアリングシステムは、明確さ、具体性、文脈、エッジケースの処理など16の次元でプロンプトを評価します。45/100のスコアのプロンプトは出荷されるかもしれません。95/100のスコアのプロンプトは法廷でハルシネーションを起こしません。これは魔法ではありません。インフラです。
ガバナンスについて考えてみましょう。Claude Code、Cowork、MCPがデプロイメントレイヤーを構築しています。クラウドでエージェントを実行して安全を祈るのではなく、コンテナ化されたバージョン管理された追跡可能な環境で実行します。すべての決定をログに記録します。監査できます。元に戻せます。すべてを再展開せずに変更できます。
このレイヤーを後回しにした企業が制裁を受けています。1,200件。11万ドルの罰金。 そしてそれは加速しています。
ハルシネーション税
インフラレイヤーをスキップするとどうなるか:
47%のユーザーが、AIシステムのハルシネーションされたコンテンツに基づいて意思決定を行っています。 モデルが悪いからではありません。バリデーションレイヤーがなかったからです。プロンプト品質のチェックがなかったからです。展開されるものに対するガバナンスがなかったからです。エージェントを放して、あとは祈るだけです。
これがハルシネーション税です。そしてこれはモデルの問題ではありません。ガバナンスの問題です。
現在のLLMのハルシネーション率は**複雑なタスクで15〜20%**です。これは法的調査には許容できません。財務上の推薦には許容できません。医療上の判断には許容できません。ではどうすればいいか?
より良いモデルを待つのではなく、バリデーションを構築します。展開前にプロンプトをスコアリングします。バージョン管理します。テストスイートを通じて実行します。ガードレールと共に展開します。出力をログに記録します。監査します。何かがうまくいかなかったときのロールバック計画を持ちます。
これはエンタープライズ展開のための最低条件です。そしてほとんどの企業はこれを持っていません。
エージェントゴールドラッシュは本物。インフラはそうではない。
NVIDIAがオープンエージェントプラットフォームを立ち上げたのは、エージェントの構築が難しすぎると思っているからではありません。未来はエージェントを構築することではなく、エージェントを安全で監査可能で本番対応にするインフラを構築することだと知っているからです。
次の18ヶ月は厳しいものになるでしょう。企業はスキルガバナンスなしにエージェントを展開するでしょう。スコアリングされていないプロンプトを実行するでしょう。バリデーションなしにシステムを統合するでしょう。制裁を受ける企業もあるでしょう。ハルシネーションに基づいて意思決定する企業もあるでしょう。損失を出す企業もあるでしょう。
勝者は最も派手なエージェントを持つ企業ではありません。その下に最も強固なインフラを持つ企業です。スキルを標準化した企業。プロンプトをスコアリングした企業。エージェント展開にガバナンスを組み込んだ企業です。
これには、企業がAIについての考え方を変える必要があります。「エージェントを構築する」のではなく、「エージェントを機能させるレイヤーを構築する」のです。
インフラは今まさに構築されています。SKILL.mdが標準として台頭しています。プロンプトスコアリングは理論から本番へと移行しています。展開プラットフォームはエージェント固有の機能を追加しています。MCP(Model Context Protocol)が統合標準となりつつあります。
このインフラで最も速く動く企業が、エンタープライズAIの次のフェーズを制します。他の企業は制裁を受けることになります。
Prompeteer.aiについて:Prompeteer.aiはエンタープライズAIのインテリジェンスレイヤーを構築しています。16の次元でプロンプトをスコアリングし、PromptDriveでバージョン管理し、完全なガバナンスを備えた本番環境に展開します。「エージェントを出荷する」から「機能するエージェントを出荷する」への移行を企業に支援しています。
出典:NPR、The Week、NVIDIA、VentureBeat、Distributed Thoughts