4
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

生成AIアップデートまとめ(2025/9/1週)

Posted at

週刊生成AI with AWS – 2025/9/1週

AWS Transform アセスメントに分離ストレージが含まれるように

AWSは「Transform Assessment」に新たな機能を追加し、オンプレミス環境にある切り離されたストレージ(Detached Storage)の分析が可能になりました。

対象ストレージ:

・SAN(Storage Area Network)
・NAS(Network Attached Storage)
・ファイルサーバー
・オブジェクトストレージ
・仮想環境のストレージ

提供される分析内容:

・AWSへの移行におけるTCO(総所有コスト)の比較
・Amazon S3(オブジェクトストレージ)
・Amazon EBS(ブロックストレージ)
・Amazon FSx(ファイルシステム)などへの移行推奨
・コンピュートとストレージのパフォーマンス最適化とコスト削減提案

背景:

ストレージは全体の移行機会の最大45%を占める重要な要素であり、より正確な移行判断と可視化を支援

提供リージョン:

・米国東部(バージニア北部)
・欧州(フランクフルト)

AWS Transform for VMware が柔軟なネットワーク管理とより広い AWS リージョンカバレッジをサポート

1. IPアドレスの柔軟な管理が可能に

・VPCのCIDR(IPレンジ)変更をサポートし、オンプレミスとAWS間でIP競合を回避。
・VPC CIDR変更時には、関連リソース(サブネット、セキュリティグループ、ルートテーブルなど)を自動更新。

IP管理方法は以下の3つから選択可能:

・元のIPアドレスを維持
・新しいCIDRに合わせたIPに変更
・DHCPによる自動割り当て

2.対応リージョンの拡大

新たに以下のリージョンが移行先として追加:
・米国東部(オハイオ)
・欧州(ストックホルム、アイルランド)

3. エージェント型AIによる自動化

VMwareワークロードのモダナイゼーションを加速するAIサービス。
以下のプロセスを自動化:
・アプリケーションの検出
・依存関係のマッピング
・移行計画の作成
・ネットワーク構成
・サーバー移行

Amazon BedrockでAnthropic Claudeモデルの簡素化されたキャッシュ管理機能を開始

Amazon Bedrock の Anthropic Claude モデル (Claude 3.5 Haiku、Claude 3.7、Claude 4) で、使いやすさが向上されたプロンプトキャッシング機能が利用できるようになりました。

キャッシュ管理の簡素化

・これまで開発者はキャッシュポイントを手動で管理し、再利用するセグメントを指定する必要がありました。
・今回のアップデートにより、リクエストの末尾にキャッシュブレークポイントを設定するだけでOK。
・システムが自動的に「最も長いキャッシュ済みプレフィックス」を読み取り、再利用します。

開発者の負担軽減

・キャッシュロジックの管理が不要になり、開発効率が向上。
・キャッシュから読み取ったトークンは、TPM(Token Per Minute)制限にカウントされないため、より多くのトークンを使用可能。

ユースケースの拡張

・マルチターンのワークフローやリサーチアシスタントの構築が容易に。
・パフォーマンス向上とコスト削減の両立が可能。

Amazon Bedrock がアジアパシフィック (ジャカルタ) リージョンで利用可能に

各リージョンのモデルの対応状況はこちらから確認できます。

Amazon BedrockがAnthropic Claude Sonnet 4のグローバルクロスリージョン推論をサポート開始

Global Claude Sonnet 4推論プロファイルを使用して、処理用にサポートされている任意の商用AWSリージョンに推論リクエストをルーティングすることができます。

クロスリージョン推論の概要

・地理ベースのプロファイル(例:US、EU、APAC)
→ 指定された地理内の最適なリージョンにルーティング。
・グローバルプロファイル
→ 全商用リージョンから最適なリージョンを自動選択。

AWS が Amazon Bedrock の API キーを管理するための 3 つの新しい条件キーのサポートを追加

新しい条件キーは、生成、有効期限、および許可されるAPIキーのタイプを制御するのに役立ちます。

・iam:ServiceSpecificCredentialServiceName 条件キー:IAM サービス固有のクレデンシャルを作成する際に、どのターゲット AWS サービスが許可されるかを制御できる。

・iam:ServiceSpecificCredentialAgeDays 条件キー:
作成時の Bedrock 長期 API キーの最大期間を制御できる

・bedrock:BearerTokenType 条件キー:API キーが短期か長期かに基づいて、Bedrock リクエストを許可または拒否できる

Amazon Neptune が生成AIアプリケーションの長期記憶を支援するZepとの統合を発表

Zepとは?

Zepは、オープンソースのメモリサーバで、LLMアプリケーションがユーザーとの対話履歴を
永続化(保存)、検索、リッチ化(構造化・意味付け) できるようにするツール。
AIエージェントに長期的な記憶と文脈を提供し、より自然でパーソナライズされた応答を可能にします。

技術的な強み

・マルチホップ推論:複数の記憶ノードをまたいで推論できる。
・ハイブリッド検索:グラフ・ベクトル・キーワード検索を組み合わせて、より精度の高い情報取得が可能。
・Zepの「メモリ・オーケストレーション」と Neptune の「グラフネイティブな知識表現」を融合することで、文脈を理解するインテリジェントなLLMエージェントが構築可能。

Amazon EKS の Split Cost Allocation Data が NVIDIA および AMD GPU、Trainium、Inferentia 搭載 EC2 インスタンスをサポート

Amazon EKS(Elastic Kubernetes Service)で実行される アクセラレータ搭載ワークロード(Trainium、Inferentia、NVIDIA、AMD GPU)に対して、コンテナレベルでのコスト追跡が可能になりました。

これにより、従来の CPU・メモリコストに加えて、GPUなどのアクセラレータリソースのコストも把握できます。

コストデータの取得方法

・コスト情報は AWS Cost and Usage Report(CUR 2.0) に含まれます。
・Amazon QuickSight の Containers Cost Allocation ダッシュボードで可視化可能。
・Amazon Athena の CUR クエリライブラリを使って、詳細なコスト分析も可能。

4
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?