1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

MITは生成AIパイロットの95%が失敗すると言う:成功の確率を高める方法

Posted at

生成AIパイロットを立ち上げたものの停滞してしまった経験があるのは、あなた一人ではありません。

MITの報告(英語)によると、生成AIパイロットの失敗はテクノロジーそのものではなく、組織がAIを実際のプロセスに適応させたり統合したりできないことに起因しています。なぜ95%が失敗するのか、残りの5%がどのように成功しているのか、そして不安定な実験をスケーラブルでエンタープライズ対応のAIに変えるためのベストプラクティスを探りましょう。

エンタープライズの顧客への最近の調査では、AIへの取り組みがパイロットフェーズ後に勢いを失う主な理由が明らかになりました。

  • 既存システムとの適合性の低さ (40%)
  • ユーザーが出力を信用しない (33%)
  • オーナーシップの不明確さ (23%)
  • 使用状況に応じて進化しないツール (5%)

見出しの先へ:MITは本当にAIエージェントが機能しないと言ったのか?

「企業が生成AIに300億ドルから400億ドルを投資しているにもかかわらず、このレポートは、組織の95%がゼロリターンであるという驚くべき結果を明らかにしています。」
The GenAI Divide State of AI In Business 2025 (MIT)

MITによると、AIイニシアチブで成功するのはわずか5%で、そのほとんどが内製ではなく外部ベンダーを通じて実現されています。アーリーアダプターは蓄積されたトレーニングデータを通じて競争優位性を獲得し、遅れをとっている企業にとっての猶予期間を縮めています。MCPやA2Aのような本番環境対応のインフラストラクチャーがあれば、組織は、アーリーアダプターが今後10年間の市場での地位を決定づける優位性を確立するまでに、学習可能なシステムへ転換するための期間がおよそ18か月あります。従業員はChatGPTのような消費者向けツールを使って「シャドーAI経済」から価値を引き出していますが、公式のパイロットプロジェクトは停滞しています。

今日のほとんどの企業は、以下の3つの経路のいずれかを介してAIエージェントを活用しようとしていますが、そのすべてが不十分です。

  • ChatGPT、Claude、Geminiなどの既製ツール: それ自体は強力ですが、企業内ではすぐに混乱を引き起こします。中央での可視性のないサイロ化されたエージェント、導入やROIを測定する方法がないこと、作成または共有されているコンテンツに対する制御がほとんどないことです。ビジネスユーザーは互いに簡単に学ぶことができず、IT部門はアドホックな実験をスケール可能なエンタープライズグレードの資産に変えることができません。その結果、説明責任のないエージェントのスプロール(無秩序な拡大)が発生します
  • 自作(Do-it-yourself): 一部の組織は、独自の内部「Agent Hub」を構築しようとします。しかし、モデル、データパイプライン、エンタープライズシステム、コンプライアンス要件を統合された使いやすい製品に接続するには、膨大な時間とリソースが必要です。それが稼働する頃には、市場はすでに先に進んでおり、継続的なメンテナンスコストがメリットを上回ります。結果として、費用がかかり、壊れやすく、期待に応えられないシステムが出来上がります
  • 単一のクラウドプロバイダーへの依存: クラウドプロバイダーは、企業を自社のエコシステム(自社のコンピューティング、モデル、プラットフォーム)に囲い込む動機付けがあります。これは、柔軟性の制限、より高い切り替えコスト、そしてイノベーションの制約を意味します。急速に進化しているこの分野において、ベンダーロックインは戦略的なリスクとなります

私たちは、エージェントアプリケーション構築の初期段階にいます。初期のWebと同様に、ベンチマークを追いかけることよりも、ワークフローを理解し、KPIを定義することが重要です。前述のように、生成AIへの数十億ドルの投資にもかかわらず、静的なシステムは学習、適応、コンテキストの保持ができないため、推定95%が依然として失敗しています。パートナーシップがほぼ2倍の頻度で成功するのは、購入が本質的に優れているからではなく、実際のビジネスでの使用に応じて進化する適応性の高いシステムをもたらすからです。

真の問題は「自作するか、購入するか」ではなく、あなたのエージェントAIアプリケーションとシステムが継続的に学習することでスケールできるかどうかです。進むべき道は、ワークフローに完全に統合された学習可能なシステムを提供する外部パートナーシップへの転換です。この記事の最後で、この集中化された最新のAIプラットフォームのアプローチをハイライトします。

真の問題は「自作するか、購入するか」ではなく、あなたのエージェントAIアプリケーションとシステムが継続的に学習することでスケールできるかどうかです。進むべき道は、ワークフローに完全に統合された(英語)学習可能なシステムを提供する外部パートナーシップへの転換です。この記事の最後で、この集中化された最新のAIプラットフォームのアプローチをハイライトします。

image.png
Webセミナー(英語):Beyond the Headlines: Did MIT Really Say AI Agents Don't Work?

パイロットフェーズ後に勢いを維持する方法

下記の原則に従うことで、企業は誇大広告を追いかけるのをやめ、真に信頼できるインテリジェントなシステムの構築を開始し、コスト削減と効率化を図りながら、中核的な能力に集中できるようになります。

1. KPI、目標、プロセス、文書化で基盤を構築する

スケーリングの前に、環境を理解することが重要です。ワークフロー、依存関係、リスクを文書化することで、チームは自動化しているものの全体的な複雑さを把握できます。明確な目標とKPIを定義することは、エンジニアからマネージャーまで、誰もが成功が何を意味するのかを共通理解することを保証します。

2. 監視を伴う自動化

自動化は強力ですが、チェックされていない自動化は静かに失敗する可能性があります。エージェントが反復的なタスクを処理する場合でも同様です。制御された委任の原則、つまり、人間が説明責任を負いながらAIに作業を行わせ、出力がビジネスニーズと一致し続けるようにすることが重要です。

3. ワークフローを自律的、かつ透明性高く実行する

信頼と説明責任は、AIをスケールするための重要なイネーブラー(実現要因)です。真のスケールには自律的な実行が必要ですが、透明性のない自律性は不信感を生みます。これは、ロギング、フォールバックメカニズム、および明確なレポートの重要性を強化し、ガバナンスと可視性が運用上の自律性から切り離せないことを示しています。

より大きなワークフローにオーケストレーションできる、小規模で影響力の大きいエージェントに焦点を当てることで、スケーリングは段階的、測定可能、かつ安全であるべきです。単純な量ではなく、インテリジェントな設計が効果的な導入を促進します。

DataikuのAI戦略責任者であるKurt Muehmelは、次のように述べています。「ワークフローをモジュラーエージェントとツールに分解することで、ロジックの追跡、デバッグ、再利用が容易になります。」

5. 継続的なガバナンス、監視、反復

AIは「設定して放置」するものではありません。スケーリングは、継続的な監視、オーナーシップの割り当て、コンプライアンスの強制を必要とする進行中のプロセスです。「Humans-in-the-loop」(人間の関与)と「experts-in-the-loop」(専門家の関与)は、AIの洗練と、より大きなユーザビリティーと導入のための信頼を促進するために不可欠な、フィードバック、洗練、適応の重要性を強調しています。持続可能なAIは、初期導入だけでなく、ガバナンスと反復的な改善に依存しています。

これらの手順に従うことで、組織は実験段階からエンタープライズグレードのAIへと移行し、勢いを維持し、真の価値を引き出し、技術的な信頼とともに測定可能なROIを達成することができます。

Dataikuで、信頼と統一されたOps(運用)をもってAIをスケールする

MITの「パイロットを超えて:成果を出すエージェントAIの構築(英語)」で強調されているように、パイロットからエンタープライズAIへのスケーリングには、信頼できるアーキテクチャが必要です。AIは既存のシステムと統合され、一貫した出力を得るために管理され再利用可能なコンポーネントを活用する必要があります。成功している組織は、AIをビジネス・プロセス・アウトソーシング(BPO)パートナーシップのように扱い、技術仕様よりもカスタマイズを要求し、ビジネス成果を測定します。

根本的な失敗はモデルの品質ではありません。適応性のないシステムが原因ではなく、脆いLLMラッパーにあります。また、失敗を追跡し、そこから学び、継続的に改善しながら、完璧さではなく、レジリエンス(回復力)と信頼のために設計することを意味します。

Dataikuは、MLOps、LLMOps、DataOps、AgentOpsのプラクティスを一貫性のある運用モデルに統合する、統合されたAI Ops(英語)を備えたDataikuの統一されたOps戦略を通じて、AIイニシアチブをパイロットから本格的な本番環境に移行することを容易にします。これらの多様な運用プラクティスを単一のフレームワークに統合することにより、XOpsアプローチはモデル管理、監視、および自動化を合理化し、効率を高め、複雑さを軽減する集中型システムを提供します。

エージェントは、Dataikuの統一されたOpsアプローチの下で恩恵を受け、企業全体で確実に機能するために必要なコンテキスト、構造、およびフィードバックを獲得します。統合されたパイプライン、モデル、ワークフローにより、必要に応じて適応し、問題をエスカレーションし、運用上の洞察から学習することができます。その結果、より信頼性の高いパフォーマンスと、日常的なタスクを超えて意味のある影響をもたらす能力が得られます。

DataikuとDoublewordによるWebセミナーをご覧ください

DataikuのKurt MuehmelとDoublewordのMeryem Arik氏がMITの記事を解説するとともに、真のビジネス価値を生み出すAIエージェントの構築について、実績のある戦略を紹介しています。
→Webセミナー(英語)を視聴する



原文:MIT Says 95% of GenAI Pilots Fail: Here’s How to Beat the Odds

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?