Amazon CloudWatch と Application Signals の AI 支援トラブルシューティング用 MCP サーバー
AIによる自動化されたトラブルシューティングと監視を強化する2つの新しいModel Context Protocol (MCP) サーバーを発表しました。
・CloudWatch MCPサーバー
アラームベースのインシデントレスポンス、メトリック分析、ログパターン検出をサポート
・Application Signals MCPサーバー
サービスレベル目標(SLO)によるサービスヘルス監視、OpenTelemetry データを使用した自動根本原因分析
運用上のトラブルシューティングシナリオに特化して設計されたツールのキュレーションセットが提供
Amazon Neptune AnalyticsがGenAIアプリケーション向けにMem0との統合を開始
アップデートのメリット
Neptuneを記憶検索と推論のためのグラフストアとして使用でき、AIエージェントの長期記憶を実現し、よりパーソナライズされたコンテキスト認識型のAI体験ができる
Neptuneの役割
記憶検索と推論のためのグラフストア。
リッチに接続されたグラフ全体でAIエージェントの長期記憶をサポート。
Mem0の利点
大規模なメモリ・グラフの保存と照会が可能。
LLM(大規模言語モデル)が各インタラクションから学習し、時間と共にパーソナライズされる。
機能強化
Neptuneを外部メモリストアとして使用。
マルチホップグラフ推論により応答品質を向上。
グラフ、ベクトル、キーワードモダリティのハイブリッド検索をサポート。
Mem0の特徴
パーソナライズされたコスト効率の高いGenAI体験を提供。
自己改善型のメモリーレイヤー。
Amazon Bedrockが開発を効率化するAPIキーを導入
IAMプリンシパルやポリシーを手動で設定せずに、Amazon BedrockコンソールまたはAWS SDK内で直接アクセス認証情報を迅速に生成できます。
APIキーの種類
・短期APIキー: コンソールセッション中、または最大12時間有効。
・長期APIキー: 有効期間を柔軟に定義可能で、AWS IAMコンソールから管理。
・生成方法: Amazon BedrockコンソールまたはAPIから直接生成。
・管理方法: AWS IAMコンソールから管理。
Amazon SageMaker AIがAWSアジアパシフィック(台北)リージョンで利用可能に
機械学習の開発をサポートするAmazon SageMaker AI が、2025年6月に新しくオープンしたアジアパシフィック(台北)リージョンでの提供を開始
Amazon Q in QuickSightが7つの新しいリージョンで利用可能になりました
Q in QuickSightについて
イメージ
引用
主な特徴
自然言語クエリ
ユーザーは自然言語で質問を入力し、データに基づいた回答を即座に得ることができます。例えば、「今年の売上は?」といった質問に対して、売上データを基にした回答を提供します。
即時応答
複雑なデータクエリを瞬時に処理し、グラフやチャートなどの視覚的な回答を提供します。これにより、迅速な意思決定が可能になります。
高度な分析
Amazon Qは、データのトレンド、異常検出、相関関係などの高度な分析を行い、ユーザーにとって有益なインサイトを提供します。
簡単な設定
管理者は、Amazon QuickSightのインターフェースを通じてAmazon Qを簡単に設定し、ユーザーがすぐに利用できるようにすることができます。
Amazon Q Developer のチャット機能が AWS Management Console を介してサービスのデータを照会可能に
AWSマネジメントコンソールだけでなく、以下から直接クエリして分析可能に。
・Slack
・Microsoft Teamsチャット
・AWSコンソールモバイルアプリケーション
利用例
・AWS S3バケットに保存されたトランザクションのレシートを分析
・AWS DynamoDBテーブルのレコード
・CloudWatchログのレビュー
Amazon SageMaker HyperPodが新しいオブザーバビリティー機能を発表
Amazon Managed PrometheusとAmazon Managed Grafanaを使用して監視データを可視化し、単一のダッシュボードでパフォーマンスメトリクス、リソース利用率、クラスタの健全性を確認できます。
自動化されたアラート設定やユースケースに特化したメトリクスの導出も可能です。これにより、トラブルシューティングの時間が数日から数分に短縮され、本番環境への移行が加速します。
イメージ
引用
ダッシュボードの表示例
・Total NodesやTotal GPUなどのクラスタ・レベルのメトリクス、
・GPU UtilizationやFilesystem space availableなどのクラスタ・ノード・レベルのメトリクス
デフォルトでは、ダッシュボードにはクラスタ全体のメトリクスが表示されますが、フィルタを適用して特定のホスト名または特定のGPU IDに関するメトリクスのみを表示可
フルマネージド型MLflow 3.0がAmazon SageMaker AIで利用可能に
イメージ
引用
実験追跡からエンドツーエンドの観測可能性が提供され、モデルやAIアプリケーションのパフォーマンスを容易に監視できます。
実験から本番までのパフォーマンス分析ツールが不足していましたが、フルマネージドMLflow 3.0により、単一のツールで実験追跡とパフォーマンス監視が可能
これにより、バグや予期せぬ動作の原因を迅速に特定し、トラブルシューティングの時間を短縮できます。
Amazon SageMaker HyperPodがAIワークフロー用のCLIとSDKを一般提供開始
アップデートのメリット
開発者や機械学習(ML)実務者は、SageMaker HyperPod上で大規模なAIモデルの構築、トレーニング、デプロイが容易
さらに、簡単なコマンドを使用してシステムログや観測可能性ダッシュボードにアクセスでき、問題のデバッグやモデル開発の迅速化が可能
SageMaker HyperPod CLI
HyperPodクラスタの管理と実験をシンプルかつ一貫したコマンドラインエクスペリエンスで提供
SDK
分散トレーニングおよび推論機能への直感的なプログラムアクセスを提供し、細かいワークロード設定が可能