2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Amazon Bedrock(Claude Sonnet 4.5)の推論を日本リージョンに限定したい

Posted at

目次

#1.はじめに
#2.クロスリージョン推論について
#3.プロファイル「JP Anthropic Claude Sonnet 4.5」を指定して実行する
#4.まとめ

1.はじめに

AmazonBedrockではコンソール上で有効化するだけで、実際にモデルを動かすことが可能です。
※2025/10/5より有効化も自動になっています(Amazon Bedrock がサーバーレス基盤モデルの自動有効化によりアクセスを簡素化)

このような手軽さからかPoCではガツガツモデルを使えますが、いざ本格利用となった時にモデル自体の信頼性やデータのガバナンスについて議論となることがあります。
(学習はされないの?モデルはどこで動いているの?など)

今回はタイトルの通り、ガバナンスの観点からAmazonBedrockで動作するモデル(Claude Sonnet 4.5)を日本リージョンでの推論に限定したいというニーズに対する対応を検討しようと思います。

2.クロスリージョン推論について

まずはクロスリージョン推論について整理します。
以下ドキュメントを確認すると、クロスリージョン推論についての説明があります。

ドキュメント:クロスリージョン推論によりスループットを向上させる

クロスリージョン推論では、特定の地域 (米国や欧州など) に関連付けられたクロスリージョン推論プロファイルを選択するか、グローバル推論プロファイルを選択できます。特定の地域に関連付けられた推論プロファイルを選択すると、Amazon Bedrock は推論リクエストを処理するために、その地域AWS リージョン内の最適なコマーシャルを自動的に選択します。グローバル推論プロファイルを使用すると、Amazon Bedrock はリクエストを処理するために最適な商用 AWS リージョンを自動的に選択し、利用可能なリソースを最適化してモデルのスループットを向上させます。

つまり、今回実施した日本リージョンに限って推論を行いたいというニーズは特定の地域に絞ったクロスリージョン推論で実現ができます。
名称としては地理的クロスリージョンで、以下ドキュメントに説明があります。
ドキュメント:地理的クロスリージョン推論

地理的クロスリージョン推論は、データ処理を指定された地理的境界 (米国、欧州、APAC など) 内に維持し、単一リージョン推論よりも高いスループットを提供します。このオプションは、データレジデンシー要件とコンプライアンス規制がある組織に最適です。

ただし、いくつか注意点があるのでそちらを補足します。

注意点

  • クロスリージョン推論は任意機能のように見えるが、Claude 4.5 Sonnetでは推論プロファイル経由でのみ利用可能であり、結果としてクロスリージョン推論の仕組みを前提としている
    ⇒モデルのページの推論タイプに「クロスリージョン推論」の記載があり、クリックして確認すると推論プロファイルを通じてのみ利用できるようです。
    image.png

少し古いモデルであるClaude 3.5 Sonnetについては推論タイプの項目がありませんでした。Claude 3.5 Sonnet は単一リージョン推論が可能で、必ずしも推論プロファイルを必要としないようです。

  • クロスリージョン推論で利用する推論プロファイルはAWSから提供されるもので、自作することはできない
    ⇒これは私が勘違いしていたのですが、対象のモデルが利用可能なリージョンであればある程度自由にプロファイルを作成できると勘違いしていました。実際にはAWS側で用意されているプロファイルの指定のみが可能な仕組みのようです。

Claude Sonnet 4.5の日本国内に閉じたプロファイルは以下AWSブログで紹介されており、最近使えるようになったようです。
Amazon Bedrock で日本国内に閉じた Anthropic Claude 4.5 の推論が可能に!日本国内クロスリージョン推論のご紹介

3.プロファイル「JP Anthropic Claude Sonnet 4.5」を指定して実行する

今回はプレイグラウンドを使って推論プロファイルを読み込んで実際にプロンプトを送ってみます。

まず、プレイグラウンドのモデル選択にて以下のようにカテゴリ、モデル、推論プロファイルを選択します。
image.png

これで推論プロファイルが設定できているはずなので、プレイグラウンドでプロンプトを送ります。

image.png

応答が返ってきたのでCloudTrailでログを確認してみます。

image.png

「ConverseStream」イベントで実際にプロファイルが利用されていることが確認できました。

実際に推論が東京リージョン、大阪リージョンで動作しているところまで確認しようと思い、複数回リクエストしてみたのですが、現状CloudTrailから大阪リージョンで動作しているところは確認できませんでした。
ここは調査不足の部分となりますが、もしかしたら実際に推論しているモデルのリージョンはログ上には記録されない仕様なのかもしれません。

4.まとめ

今回はClaude Sonnet 4.5を日本リージョンに限定する目的で、推論プロファイルを指定してみました。
先日ベータ試験が開始されたAIP-C01もチャレンジしたいですし、
トレンドとしてもAmazonBedrockの知識は今後必須かと思うので、キャッチアップを継続していこうと思います。

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?