はじめに
本記事は以下の英語記事の要約、翻訳記事になります。
要約
はじめに
- 本記事は、AIの時代における自動化の進化を辿り、現在および進化しつつあるサービスを掘り下げる
自動化の進化予測
- 消費者から知識労働者まで、誰もがAIアシスタントを持つようになる
- 垂直アプリケーション、自動化プラットフォーム、ITサービス間の境界が再定義され、新たな市場機会が生まれる
- AIアシスタントは、既存プラットフォームのコパイロットから、AIを組み込んだアプリケーション、様々な形態のAIエージェントまで多岐にわたる
- 人間参加型(Human-in-the-loop)が、生成AI(generative AI)ソリューション展開の基本的なフレームワークとなる
- 現在のユースケースは主に実験段階または初期の生産段階で、アドバイザリーおよびアシスタント指向のワークフローに重点が置かれている
- LLMはまだ予測可能な計画や推論ができず、メモリやコンテキストなどの分野は研究中である
- 確定的な実行が重要な自動化プラットフォームでは、LLMは「設計時」の特定のタスクに使用されている
- 自動化は難しい問題であり、しばしば過小評価される
- 既存企業は、プラットフォームの効率とUXを改善するためにAIを取り入れている
- 最先端のLLMプロバイダーは、ユーザーがAIエージェント(GPT)を迅速に構築できるように、エージェントモデリング、コラボレーション、ツールへのアクセスを追加している
- 差別化するには、ユニークなデータセットとシンプルなUXに基づいて再構想されたワークフローで顧客価値を提供する必要がある
- AIを使った自動化の展開は、「クロール、ウォーク、ラン」のアプローチをとる
- 単純なタスクから始めて徐々により複雑なワークフローへと進む
- エージェントを使った実験を続け、AIの価値が発揮される場所を学習し、データ、ツール、ランタイムの適切な「足場」を自動化アーキテクチャに組み込むことが重要である
- AIモデルの機能向上に合わせて、徐々により多くのAI機能を活用する方向にスケールを調整できる
- コード生成は、genAIベースのアプリケーションおよびエージェンシー自動化プラットフォーム開発の基本的な要素として浮上している
- コードはテキストの一形態であり、明確なパフォーマンス指標を持っているため、LLMの機能として理想的である
- コーディングコパイロットの初期バージョンは広く展開されており、AIを活用した本格的な開発者プラットフォームも登場している
- コード生成LLMは、エージェントアーキテクチャにおいて重要な役割を果たす
自動化プラットフォームの進化
- 自動化は人間の絶え間ない努力である
- 知識労働者は、生産性を高めるための反復コマンドのショートカットである「マクロ」に精通している
- 初期の自動化の取り組みは、見積もりから現金回収、給与計算などのワークフローに焦点を当てていた
- エンジニアが静的なルールと定義によって管理されるワークフローを繋ぐためにカスタムコードを書いていた
- これらの脆弱な初期のアプローチは、第一世代の自動化プラットフォームの開発を促進した
- ロボティック・プロセス・オートメーション(RPA)プラットフォーム
- 統合型プラットフォーム(iPaaS)
- ローコードタスク自動化プラットフォーム
- 様々な垂直自動化アプローチ
- これらのプラットフォームは反復作業を大幅に削減したが、複雑さや脆弱性の問題は残った
- GenAIは、既存企業、ビルダー、研究者それぞれの取り組みにより、自動化の旅を加速する可能性を秘めている
AI自動化アーキテクチャの進化
- 予測AI、生成AI、汎用AIの進化が見られる
自動化におけるAI: 異なるプレイヤー、アプローチ
- 企業における自動化は複雑なタスクであり、genAIの登場により既存企業とスタートアップ/スケールアップ企業は異なるアプローチをとっている
- RPAおよびタスク自動化プラットフォームは、自動化されたワークフローの深いライブラリと企業との協業経験による既存の優位性を持つ
- GenAIは、脆弱性とブートストラップの問題に対処する機会を提供する
- Microsoft 365やNotionなどのアプリケーションプラットフォームは、AIをプラットフォームとユーザーワークフローに直接組み込んでいる
- AI中心のアプローチは、アプリケーションやワークフローを第一原理的な観点から再構想する
- 新世代の生産性ツールやverticalアプリケーションがgenAI機能を使用して複雑なワークフローを簡素化している
- LLMプロバイダーとスタートアップ/スケールアップ企業は、エージェントを活用した新しいアプローチで自動化に取り組んでいる
- 単純なワークフロー用にLLMをラップするアプローチ
- 複雑なワークフローやアプリケーション用に「足場」を備えたLLMを接続するアプローチ
- エージェンシー自動化は絶え間ないイノベーションと研究の領域である
- RPAおよびタスク自動化プラットフォームは、自動化されたワークフローの深いライブラリと企業との協業経験による既存の優位性を持つ
RPAおよびタスク自動化プラットフォーム
- 現在の自動化プラットフォームは、新しいMLやAIモデルを積極的に採用している
- ユーザーインターフェースは、自動化の構築、デプロイ、検証、監視、使用状況の追跡、ROIの測定に使用される
- iPaaSは、データ統合のミドルウェアとして重要な役割を果たす
- 自動化レイヤーは、事前構築されたプレイブック、予測MLモデルとツールのライブラリ、新しいワークフローを実行する
- 既存企業は、ユーザーエンゲージメントを簡素化し、新しいワークフローを提供するためにgenAIを使用している
- AIツールは、既存企業の優位性構築に役立ち、より良いUI/UXはブートストラップを削減する
- LLMの機能進化に伴い、RPAおよびタスク自動化の機能向上が期待される
エージェンシー自動化フレームワーク: コパイロット/GPTとエージェント
- コパイロット:既存のアプリケーションやプラットフォームに対するgenAIベースのインターフェース
- エージェント:LLMの機能とコード、データソース、UIを組み合わせてワークフローを実行する
- LLMを単純にラップするアプローチ
- 特定のタスク用に訓練されたLLM
- タスク固有のエージェント、事前定義されたコード/ワークフロー、外部ツールを組み合わせた「足場」を備えた
専門家の混合アーキテクチャ
- 汎用エージェントは、タスクを説明するだけで自動化することを目指すが、継続的なAIの進歩が必要である
ノーコードエージェント/GPT
- AIエージェントは、LLMのネイティブ機能を基にした実験として始まった
- LLMプロバイダは、カスタムバージョンのLLMを構築するためのノーコードプラットフォームとプラグインのライブラリを提供している
- ノーコードコンソールでタスクを詳細に記述したり、few-shot promptingでタスクエージェントを構築したり
- データソースやアプリケーションとの統合、独自データの利用が可能
- 外部ツールへのAPIアクセスも提供される
- 単純なタスクや一回限りの自動化には、このアプローチが適している
高度なAIエージェント
- 高度なエージェントは、LLMの機能を中心に、様々な要素を統合するグルーコードで構築される
- LLMプロバイダは、エージェントモデリング、コラボレーション、ツールアクセス、事前構築された機能、リフレクション、安全性ガードレールなどの新機能を継続的に提供し、エージェント構築のための強力なプラットフォームとなっている
専門家の混合(MoE)エージェントアーキテクチャ
-
Bardeen、Imbue、MultiOnなどのビルダーは、MoEエージェントフレームワークで複雑なワークフローに確定的な結果を提供する問題に取り組んでいる
- ワークフローをタスクに分割し、特定のエージェントや機能に割り当て、必要な「足場」を提供する
- ユーザーインターフェースは、ユーザーがタスクを説明し、関連するコンテキストを提供するためのLLMを備えている
- 新しいUIアプローチは、ユーザーコンテキストとインタラクティブ性を取り入れ、ユーザーがエージェントを操作し、出力を洗練できるようにしている
- 人間参加型(Human-in-the-loop)インターフェースにより、ユーザーが入力を提供し、最終出力を認証できる
- タスクエージェントには、プランニングエージェント、ルーティングタスク、機能エージェント、コード生成エージェント、リフレクションLLMなどがある
- 確定的なランタイムは、様々なタスクからの出力を組み合わせて、一貫して正しい最終出力を提供するために重要である
- MoEアーキテクチャの中核的な設計原則は、AI/MLモデルを必要な場所でのみ使用し、事前定義されたワークフロー/プレイブックを活用することである
- LLMは設計時に使用され、確定的なランタイムで合成される
- エージェントと人間のAIインターフェースは、今日のアーキテクチャの重要な側面である
- ビルダーは、ユーザーコンテキストにエージェントを接地するために様々なアプローチをとっている
- LLMプラグインは、エージェントにより多くのスキルを与えるために、外部データやツールを取り込む
- エージェントは、APIを使用して、電子メール、生産性ツール、コミュニケーションツールなどのユーザープラットフォームと通信し、典型的な人間のワークフローを模倣できる
- エージェント間インターフェースは、活発な研究開発の領域である
- MoEモデルでは、異なる能力を持つタスクエージェントが相互作用する必要がある
- 将来的には、エージェントが他のエージェントと相互作用してタスクを達成することが想定される
自動化を展開する企業の考慮事項
- ほとんどの企業は、すでに様々な自動化プラットフォームを使用している
- AIによる生産性向上は、まだ宣伝ほどではない
- genAIベースの自動化の候補は、費用対効果の分析を経る必要がある
- 以前のアプローチと同様の成熟曲線をたどることになる
- 「データが重要」である
- AIエージェントのパフォーマンスは、トレーニングデータの品質と関連性に直接関係する
- 企業にとって、クリーンで焦点の絞られたデータセットとパイプラインを作成することが旅の始まりである
- LLMの状況は急速に進化している
- GPT5/Llama3のリリース目前で、SOTA(state-of-the-art)の基準が再設定される
- 同時に、GPT4レベルのパフォーマンスを持つ複数のモデルが、魅力的なコストで利用可能になっている
- 企業は、ユースケースと機能的なニーズに基づいて、異なるソースの様々なコストパフォーマンスレベルのモデルから選択できる
- プラットフォームレベルでは、市場には複数の選択肢がある
- 既存企業は、ユーザーのタイムトゥバリューを加速するためにAIを組み込んだりコパイロットを提供している
- スタートアップ/スケールアップ企業やLLMプロバイダーは、垂直ユースケースを再発明したり、コスト、パフォーマンス、UXを変革する新しいプラットフォームを作成するためにAIネイティブアプローチを取っている
- ワークフローとパフォーマンスのベンチマークが選択を左右すべきである
- LLMは今日、プロンプティングに非常に敏感であり、わずかな変化がモデル出力のドリフトを引き起こす可能性がある
- ユースケースレベル(モデルレベルではなく)でのパフォーマンス指標を明確に設定することが重要である
- ガバナンスとデータセキュリティについても同様である
- 人間参加型(Human-in-the-loop)は、今日のすべてのAI展開の基本的な機能である
自動化におけるビルダーの考慮事項
- ビルダーは、自動化プラットフォームにおけるgenAIで「クロール、ウォーク、ラン」のアプローチを採用できる
- ユーザー、ユースケース、そのパフォーマンスベンチマーク、LLMの機能をタスクにマッチングさせることを深く理解することが、差別化されたソリューションを構築するために不可欠である
- LLMは主にシステム1の思考家である(訓練されたデータに基づく反射的な応答)
- ビルダーは、差別化された機能が必要な場所ではLLMを使用し、可能な場所では事前定義された関数/プレイブックやMLモデルを使用している
- モデルを接地するためには、焦点を絞ったターゲットを定めたデータセットが重要である
- 複雑なユースケースでは、ユーザーコンテキスト、外部ツールとデータセットへのアクセス、リフレクションメカニズムなどを組み込むための適切な「足場」とともに、継続的な実験が不可欠である
- シンプルなテキストベースのUIは良い第一歩である
- ビルダーは、リアルタイムのインタラクティブ性とマルチモーダルUIを追加することで、ユーザーがLLMのタスクリストを追跡し、出力を評価し、出力を操作するためのアクティブなフィードバックを提供できるようにしている
- 適切なガバナンスを備えた差別化されたデータセットを提供し、安全性のトレードオフ、セキュリティガードレール、パフォーマンスを考慮することは、エンドユーザー環境での展開時の規制上および法令遵守の問題を回避するために重要である
生成AIエージェントのユースケース
- 企業との会話では、エージェンシー自動化において様々な取り組みが進行中である
- フォーチューン100の通信会社のCDO
- テーブルとデータベースを結合し、複数のデータソースからアクションや推奨事項を取るための自律エージェントワークフローを構築している
- グローバルコンサルティング会社のデータおよびAI担当バイスプレジデント
- データアナリストがばらばらのスプレッドシートから洞察を得られるようにするためのエージェントワークフローを構築している
- フォーチューン500建設および不動産会社のデータおよびAI担当シニアバイスプレジデント
- Palantir、OpenAI、内部コパイロットを結合し、何千もの提案から勝つRFP入札を選択するためのエージェントアプリケーションを構築している
- 大手銀行のSVPは、GenAIの2つのアクティブなユースケースを挙げている
- すべてのエンジニアに展開されているコーディングコパイロットは、上級エンジニアの生産性を20%以上向上させている
- LLMを使用したドキュメントチャットでは、RAGがプライバシーを保護しながらモデルを接地する方法を大幅に改善している
- チャットボットは実験的な展開であり、安全性とコンプライアンスを考慮してこのユースケースを完成させている最中である
- 大手銀行のCDO
- 自動化が様々な形で存在すると述べている
- RPAや、ITSMなどの垂直自動化プラットフォームが大規模に導入されており、LLM上にエージェントを構築している
- エージェンシー自動化アーキテクチャを積極的に実験し、学習している
- 一部の既存ベンダーは、AIを組み込む際に大きな機敏性を示している
- フォーチューン100の通信会社のCDO