閲覧ありがとうございます。
本記事は セゾンテクノロジー Advent Calendar 2025 22日目の記事です。
re:Invent2025にて、新機能「DevOps Agent」が発表されました!
DevOps Agentとは、リソース間の関係を把握して、インシデントを調査・運用上の改善点を特定・改善方法を提示してくれるAWSのAIエージェントです。
エラー原因の特定や改善のための時間を短縮することができます。
AWS re:Invent 2025にて、AWS Security Agent、Kiro Autonomous Agentとともに発表された新サービスとなります。
APIだけでなくAWSコンソール上でも提供されているのが特徴の1つと言えますね!
re:Invent2025にて、DevOps Agentのワークショップに参加してきましたので、そこで学んだDevOps Agentって何ができるの?」「DevOps Agentってどこまでできるの?」を本記事で共有したいと思います。
2025/12/12時点ではプレビュー&バージニア北部リージョンでのみの提供となっています。
まずはCloudWatch Alarmを設定する
DevOps AgentはCloudWatch Alarmで検出されたエラーの原因特定や解消を行います。
今回はLambdaの実行エラーを検知するアラームを作成しました。(実際のワークショップではDynamoDBのエラー解析を行いました)
Lambda側では以下のように実行時間のタイムアウトが原因として挙げられています。
"errorType": "Sandbox.Timedout",
"errorMessage": "RequestId: ******** Error: Task timed out after 3.00 seconds"
Lambda内容参考:AWS DevOps AgentでLambdaエラーを解決してみる
設定値参考: LambdaのCloudWatchAlarmを設定してみる
バージニア北部リージョンで作成してください。
DevOps Agentでエラー原因を特定してみる
それでは、さっそく先ほど起きたLambdaエラーの原因を解明・解決していきましょう!
まずはAWSコンソールで「DevOps Agent」と入力します。
検索結果に出てきた「DevOps Agent」をクリックしてDevOps Agentコンソールに入ります。
コンソールに入ったら、左上「Begin Setup」をクリックします。
セットアップ画面に入ったら、最初に今回Lambdaエラーの調査をしてくれるエージェントが動くエージェントスペースの名前・説明を入力します。
次に、AIエージェントスペース(今回動いてくれるAIエージェント)がAWS内で使用できる権限を選択します。IAMロールベースでエージェントの権限も指定できるのは嬉しい点ですね!
今回は Auto-Create a new DevOps Agent role を選択しました。
タグの設定を任意で行った後、web appが使用する権限を設定します。
web appは担当者がAWS DevOps Agentと連携してインシデント調査や推奨事項の確認を行う場所です。
このwebアプリへのアクセスにもIAMベースの認証リンクを使用します。
アプリケーションをIAM Identity Centerに接続し、IDプロバイダーとの認証連携も可能とのことです。
エージェントスペースを作成したら、「Operator Access」を押下してweb appを開きます。
「DevOps Center」ではリソース同士の細かいつながりを確認することができます。
「Incident Response」でリソースのエラー調査ができます。
「Start Investigation」を押下して調査する内容を設定します。
以下の内容を入力します。
私は以下の内容で入力しました!
Investigation details: Investigate the cause of your most recent Lambda execution failure.
Investigation starting point: Check the alarm recorded in CloudWatch Alarm AokiLambdaErrorAlarm and begin your investigation.
その他: デフォルトのまま
「Start Investigating...」を押下すると以下のように調査が始まります!
右横の「Chat」では調査についてわからない点をアシスタントエージェントに質問することができます。
調査の内容を見ていきましょう。
最初にLambdaを監視するCloudWatch Alarmを見つけました。
対象のLambda関数を見つけました。
「タイムアウト」というエラー原因を特定してくれました!
最終的にエラーの原因をまとめてくれます。
根本原因が解明されました!
ここまでわずか5分ほど、ここでは出ませんでしたがこの少し前にテストで解析してもらった時には誰が捜査したか・変更はコンソール上で行われたことまで教えてくれました。
CloudTrailやCloudWatchのログを見て根本原因を解明することを思うと革命が起きていることがわかりますね😂
ちなみに、左上の「Ask for human support」を押下すると調査途中から人間のサポートの方に連携し、通常のサポートを受けることができます。個人で調査を進めた上で説明しなおさずにサポートの方に確認いただけるのはありがたいポイント!
根本原因の「Go to root cause」を押下して原因を一目で確認することができます。
DevOps Agentでエラーを解消してみる
Root causeの「Generate mitigation plan」を押下するとエージェントがエラー解消の計画を立ててくれます。
今回は指示通りタイムアウト設定を10秒に変更し、エラーを解消することができました!
DevOps Agentがエラーの再発防止策も提供
web appの「Prevention」タブから、「Run now」を押下すると予防策の思考が始まります。
予防策を提示してくれました!(10分くらいかかった)
画面下部の推奨事項を承認すると、推奨事項はテーブルに残り、追跡できるようになりるようです。拒否すると、ニーズを満たさない理由を自然言語で説明するよう求められ、入力すると拒否することができます。エージェントはこのフィードバックから学習し、将来の推奨事項に反映させます。
参考:AWS DevOps エージェントユーザーガイド
外部監視ツールとの連携
DevOps Agentコンソール画面の「Capabilities」タブを開きます。
「Telemetry」の「add」から連携する外部の監視ツールを追加することができます。
現在連携先としてサポートされているのは、
- DataDog
- Dynatrace
- New Relic
- Splunk
の4つです。
「Register」を押下して、各サービスの認証情報を入力するとサービスのアラートを検索し、同じようにエラーの原因究明や解消方法の提示をしてくれます。
以上、AWS re:Invent 2025で学んだDevOps Agentの使い方の共有でした。
どなたかのお役に立てたら幸いです。
























