■初めに
2025年12月2日のre:Invent 2025にてAWS DevOps Agentのプレビューが発表されました。
本記事ではDevOps Agentの機能と使ってみた感想をまとめます。
■DevOps Agentで何ができる?
そもそも何ができるか、公式ドキュメントや発表内容から確認してみました。
2つのドキュメントをまとめると以下になります。
■DevOps Agentとは
・インシデントの解決・予防と、信頼性/パフォーマンスの継続改善を支援する「フロンティアエージェント(新しいクラスのAIエージェント)」。
・熟練DevOpsのように、システムのリソースと関係性(依存関係)を学習し、運用ツール群(オブザーバビリティ、ランブック、コード、CI/CDなど)を横断して情報を相互関連付けしながら調査する。
・目的は主に MTTR(平均解決時間)の短縮と運用上の改善の推進。
■できること
1.インシデントを迅速に解決
自律的オンコールエンジニアとして、アラート発生直後から調査を開始。
メトリクス/ログ/検出結果から、直近のコード変更やデプロイ(GitHub/GitLab等) までを結び付けて状況把握。
根本原因の候補提示や、的を絞った緩和策(対応案)推奨により復旧を早める。
Slack等で関係者への共有や、調査の進行管理も支援。
2.将来のインシデントを予防
過去のインシデントや運用パターンを分析し、実行可能な改善提案を出す。
強化領域は (a)オブザーバビリティ (b)インフラ最適化 (c)デプロイパイプライン強化 (d)アプリ回復力の4つ。
例:トラフィック急増に備え、EKS向けに HPA推奨 など。
3.運用データから新しいインサイトを得る
ツールチェーン全体を安全に統合し、散在するデータをつなげて判断材料にする。
その基盤として、エージェントが アプリケーショントポロジ(システム構成要素と相互作用のマップ) を作成し、デプロイ履歴なども含めて調査に活かす。
※バージニア北部のみでプレビュー利用可能です。
設定してみる
コンソールでDevOps Agentを開いてスペースを作成します。
〇コンソールから調査
まずは意図的にCPUの負荷を上げてアラートを発報させます。
DevOpsAgentに調査してもらってどのような結果が表示されるか見てみましょう。

↑『Operater Access』を押下すると↓の画面に推移します。

『Start investigation』から指示に従って発報されたアラートの情報を入力します。


〇結果

手動でCPUの負荷テストをしたことが原因という調査結果を出してきました。
詳しい実行結果はDevOps-Agenttestのインシデント対応から確認できます。
■まとめ
今回使ってみた感じだとAmazon Q Developer Operational Investigationsと使用感が似ていると思いました。
(前回使ってみたときのまとめは以下です)
AIがインシデント解決まで自動で完了してくれるのが理想ですね。
〇料金について現時点ではプレビュー版のため無料となっています。
