やさしいアドベントカレンダー Advent Calendar 2025

AWS新資格「GenAI Developer Pro」で学ぶ、AIエージェント基盤のアーキテクチャ設計

Posted at 2025-12-04

はじめに

※この記事はAIと一緒に書きました。

現在、AWSの新しい上位資格である「AWS Certified Generative AI Developer – Professional」の取得に向けて学習を進めています。この資格の学習範囲は、単に「Bedrockを使ってAI機能を実装できる」というアプリケーション開発のレベルを超え、システム全体の信頼性をどう担保するかというアーキテクチャ領域に踏み込んだものだと感じました。

学習を進める中で、これまで断片的に理解していたRAGやエージェントの構成要素が、明確なシステム図として頭の中で繋がり始めました。「高精度なモデルを使えば全て解決する」というモデル依存の思考から脱却し、ガバナンスと可用性を備えた「AI基盤」全体を設計する思想へと、エンジニアとしての視座が大きく切り替わった感覚があります。

本記事では、試験対策を通じて得られたこの「視座の転換」について、技術トピックを交えて備忘録としてまとめます。

背景：モデルの「性能」よりも、システムの「継続性」へ

これまで私は、AIアプリケーションの品質を上げるために、「Claude 3.5 Sonnetのような高精度モデルをいかに使いこなすか」や、プロンプトをどう工夫して精度を上げるかといった、個別の機能実装やチューニングにフォーカスしがちでした。

しかし、実務での運用を想定した試験シナリオに向き合う中で、その視点だけでは不十分だと気づかされました。実際のエンタープライズ開発において重要なのは、個々のモデルの性能に依存することではなく、どのような状況でもシステムを止めず、ユーザー体験を損なわない「継続性」です。

例えば、高負荷時にプライマリの高精度モデルが応答しない、あるいは遅延するケースを想定してみます。この時、ユーザーにエラー画面を見せてしまうのは、体験として望ましくありません。

一つの有効な設計パターンとして、AWS Step Functionsを用いたサーキットブレーカーの導入が挙げられます。バックグラウンドのエラー率やレイテンシを監視し、閾値を超えた場合は即座にパラメータ数の少ない軽量なセカンダリモデル（TitanやHaikuなど）へ自動的にフェイルオーバーさせる手法です。

もちろん、全てのケースでこれが正解とは限りません。精度が最優先される医療や法務の分野ではあえてエラーを返す判断も必要でしょう。しかし、「最高の一答」を待ち続けるのか、それとも「体験を途切れさせない」ことを優先するのか。このトレードオフをビジネス要件に合わせて設計できるかどうかが、プロフェッショナルなアーキテクトの分かれ道なのだと感じました。

オーケストレーション：ルールとAIのハイブリッド設計

エージェント開発の要となる「オーケストレーション（指揮）」についても、AWS Step Functionsの役割を再認識しました。Step Functionsは、複数のAWSサービスをワークフローとして視覚的に定義・実行できるサーバーレスなオーケストレーターです。

AI開発においてこのサービスが強力なのは、「AIによる柔軟な判断」と「AWSネイティブな堅牢なルールベース制御」をシームレスに混在させられる点にあります。

ルールベース制御: 「信頼スコアが0.7未満なら再生成」「特定のキーワードが含まれていたら即座にエスカレーション」といった、決定論的なロジック。
AIによる制御: 「ユーザーの意図を汲み取り、次に呼ぶべきAPIを判断する」といった、確率論的なロジック。

これらを一つのステートマシン内で組み合わせることで、「不確実なAIの挙動」を「確実なAWSのワークフロー」の中に閉じ込めることができます。このハイブリッドな構成こそが、ハルシネーション（嘘の回答）のリスクを抑えつつ、AIの柔軟性を最大限に活かすための現実解だと感じました。

ガバナンス：「責任あるAI」を実装に落とし込む

今回の学習で特に意識させられたのが、「責任あるAI (Responsible AI)」という概念です。これは単なるスローガンではなく、公平性、安全性、プライバシー、透明性を担保するための具体的な開発規律です。AWSにおいては、これを精神論ではなく「Bedrock Guardrails」という機能として実装に落とし込むことが求められます。

Guardrailsは、プロンプトインジェクション攻撃の防御や、PII（個人情報）のマスキング、不適切なトピックの除外を、モデルの推論とは独立したレイヤー（APIゲートウェイ層）で強制的に実行します。

プロンプトエンジニアリングだけで安全性を担保しようとすると、モデルの更新やわずかな言い回しの変化で防御が突破されるリスクがありますが、Guardrailsを用いれば、組織のポリシーとして「責任あるAI」の基準をシステム的に適用できます。これもまた、機能実装者からアーキテクトへの視座転換の一つでした。

気づき：Bedrockの全体像が示す「あるべき姿」

そして、これら全ての学びを統合してくれたのが、Amazon Bedrockの全体像を示すこのアーキテクチャ図です。

（引用元：AWS公式 Amazon Bedrock 製品ページより）

この図を改めて眺めると、Amazon Bedrockというサービスの思想が非常によく見えてきます。

まず、「Knowledge Bases」が最下層に配置されている点です。これは、RAG（検索拡張生成）があくまで一つの機能ではなく、AgentCoreにとっての「長期記憶」として機能し、コンテキスト（文脈）を形成するための土台であることを示唆しています。企業独自のデータという「記憶」があって初めて、エージェントは実用的な振る舞いができるというメッセージだと受け取りました。

次に、左側の「Open source」領域です。ここにはMCP (Model Context Protocol) やLangGraphといったOSSのエコシステムが明記されています。AWSのサービスだけで囲い込むのではなく、進化の速いOSSコミュニティの成果も積極的に取り込み、連携させていくという姿勢が見て取れます。

そして中央の「AgentCore」と「Model capabilities」です。これまでLangChain等を用いて自前でエージェントを実装した経験がある方なら共感いただけると思いますが、実用的なエージェントをゼロから作るのは「泥臭い実装」の連続です。

推論の制御 (Runtime):「思考(Thought)→行動(Action)→観察(Observation)」のReActループを回すために、LLMの出力を正規表現でパースし、エラーハンドリングを行う複雑なロジック。
文脈の維持 (Memory): 会話が長引いた際にコンテキストウィンドウが溢れないよう、過去の履歴を要約したり、外部DBへ退避・取得したりするステート管理。
安全な実行 (Code Interpreter): LLMが生成したコードを、サンドボックス環境で安全に実行させるためのインフラ構築。

これらは本来、解決したいビジネス課題とは無関係な「足回りの苦労」です。
この図を見ると、Bedrockはそれらを「AgentCore」というマネージドな機能群としてOSのように提供していることがわかります。Runtimeが推論ループを回し、Memoryがセッション状態を管理し、GatewayがAPIとの接続を抽象化する。

この構成を見て強く感じたのは、これこそがエージェントプラットフォームの必然的な進化形だということです。高機能なエージェントシステムを構築しようとすれば、必然的に推論、メモリ、ツール連携、そしてガバナンスが疎結合になったこの構成要素に収束していきます。このアーキテクチャ図は、私たちが目指すべき「統制された自律性」を持つシステムの青写真そのものだと言えるでしょう。

まとめ

「AWS Certified Generative AI Developer – Professional」への挑戦を通じて、単なるツール利用の知識だけでなく、AI開発における「ガバナンス」と「アーキテクチャ」の解像度が劇的に上がりました。

AIを「魔法」として扱うのではなく、「ルールとAI」を組み合わせたエンジニアリングの対象として捉え、責任ある運用のためのガードレールや、止まらないシステムのためのフェイルオーバー戦略を設計する。この学びを活かし、より堅牢でスケーラブルなAIソリューションをお客様に提案していきたいと思います。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up