目次
#1.はじめに
#2.アプリケーション推論プロファイルについて
#3.アプリケーション推論プロファイルを作成する
#4.エラーの原因調査
#5.まとめ
1.はじめに
前回Amazon Bedrock(Claude Sonnet 4.5)で提供されているクロスリージョン推論プロファイルを利用して、日本リージョンでの推論を検証しました。
前回の記事:
Amazon Bedrock(Claude Sonnet 4.5)の推論を日本リージョンに限定したい
今回は単一のリージョンに限定して推論を行いたいという要件に対応可能か試してみようと思います。
※結論としては実現できず、本記事は失敗談の共有となります
2.アプリケーション推論プロファイルについて
まずはアプリケーション推論プロファイルについて整理します。
以下ドキュメントを確認すると、アプリケーション推論プロファイルについての説明があります。
クロスリージョン (システム定義) 推論プロファイル – Amazon Bedrock で事前定義され、モデルへのリクエストのルーティング先となる複数のリージョンを含む推論プロファイル。
アプリケーション推論プロファイル – コストとモデルの使用状況を追跡するためにユーザーが作成する推論プロファイル。モデル呼び出しリクエストを 1 つのリージョンまたは複数のリージョンにルーティングする推論プロファイルを作成できます。
この説明からAWS側で用意されているクロスリージョン(システム定義)推論プロファイルは複数のリージョンでの推論となりますが、ユーザ側で作成するアプリケーション推論プロファイルでは単一リージョンもしくは複数リージョンで推論させるプロファイルのようです。
※ただし本来は単一リージョンで動作させる目的というよりはコストとモデルの使用状況を確認するための仕組みのようです。
ここで私はどのモデルでも単一リージョンで動作させることができると解釈したのですが、そこが勘違いでした。詳細は後述します。
詳細を確認すると同ページに以下注意事項の記載がありました。
複数のリージョンでモデルのコストと使用状況を追跡する推論プロファイルを作成するには、モデルと、推論プロファイルによるリクエストのルーティング先となるリージョンを定義するクロスリージョン (システム定義) 推論プロファイルを指定します。
つまりアプリケーション推論プロファイルで複数リージョンでの動作を定義する場合も、ベースはクロスリージョン(システム定義)推論プロファイルなので、自由にリージョンを選択した推論プロファイルを作成することはできないようです。
3.アプリケーション推論プロファイルを作成する
それでは実際にアプリケーション推論プロファイルを作成してみましょう。
アプリケーション推論プロファイルの作成に関しては以下ドキュメントがあります。
現時点では、推論プロファイルは Amazon Bedrock API を使用してのみ作成できます。
2026/02/08時点の情報ですが、現状Amazon Bedrock APIでのみ作成が可能です。
AWS CLIやSDKでの実行の選択肢がありますが、今回はマネジメントコンソールで操作を完結させるためにCloudShellからAPIを発行してみます。
APIのリファレンスはこちらです。
https://docs.aws.amazon.com/cli/latest/reference/bedrock/create-inference-profile.html
今回は最低限リージョンが設定できればいいので、必須のパラメータのみを指定した以下のコマンドを準備します。
aws bedrock create-inference-profile
--inference-profile-name <作成するプロファイル名>
--model-source copyFrom=<モデルARN>
モデルIDはBedrockのモデルカタログ上で確認が可能です。
2026/02/08時点でのClaude Sonnet 4.5のモデルIDは以下です。

モデルIDが分かれば、AWS CLIでモデルARNの確認ができます。
$ aws bedrock get-foundation-model --model-identifier anthropic.claude-sonnet-4-5-20250929-v1:0 --region ap-northeast-1
{
"modelDetails": {
"modelArn": "arn:aws:bedrock:ap-northeast-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
"modelId": "anthropic.claude-sonnet-4-5-20250929-v1:0",
"modelName": "Claude Sonnet 4.5",
"providerName": "Anthropic",
"inputModalities": [
"TEXT",
"IMAGE"
],
"outputModalities": [
"TEXT"
],
"responseStreamingSupported": true,
"customizationsSupported": [],
"inferenceTypesSupported": [
"INFERENCE_PROFILE"
],
"modelLifecycle": {
"status": "ACTIVE"
}
}
}
それではCloudShellを起動して実際に作成してみます。
AWSのマネジメントコンソールにログインし、左下のアイコンからCloudShellを起動します。
ターミナルが起動するので、まずはAWS CLIのバージョンとリージョンを確認します。
※リージョンは画面上表示されていますが環境変数でも確認
では実際にコマンドを実行してみます。
~ $ aws bedrock create-inference-profile \
> --inference-profile-name "tokyo_only_app_profile" \
> --model-source copyFrom="arn:aws:bedrock:ap-northeast-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0"
An error occurred (ValidationException) when calling the CreateInferenceProfile operation: The provided foundation model does not support On Demand inference.
エラーとなってしまいました。対象のモデルはオンデマンドに対応していないという内容となります。
4.エラーの原因調査
出力されていたエラーについて調べていたところ、
サーバーワークスさんの記事に以下のような記載がありました。
AWSで生成AIの基盤モデルを利用するためのサービスAmazon Bedrockについて、Bedrock APIを実行するリージョン(ソースリージョン)によってリージョン内で利用可能なモデル(オンデマンド)と、複数リージョンを跨ぐ利用が必要なモデル(クロスリージョン推論)が分かれています。
つまり基盤モデルごとに単一リージョンで推論可能かどうかという定義がされており、
サポートされていないモデルでは今回私がやろうとしたアプリケーション推論プロファイルを利用した単一リージョンでの推論ができないという結論となります。
実際、今回エラーとなったClaude Sonnet 4.5について、以下のAWSドキュメントを確認すると、「単一リージョンモデルのサポート」の欄は空欄となっていました。
一方で「単一リージョンモデルのサポート」にリージョンの記載がある「Claude 3 Haiku」で同じようにアプリケーション推論プロファイルを作成してみると、エラーにならずプロファイルを作成することができました。
※ただし「Claude 3 Haiku」はもともと単一リージョンで動作することができるモデルなので、今回の要件においてアプリケーション推論プロファイルを作成する実用的な意味はあまりありません…
~ $ aws bedrock create-inference-profile \
> --inference-profile-name "tokyo_only_app_profile" \
> --model-source copyFrom="arn:aws:bedrock:ap-northeast-1::foundation-model/anthropic.claude-3-haiku-20240307-v1:0"
{
"inferenceProfileArn": "arn:aws:bedrock:ap-northeast-1:{アカウントID}:application-inference-profile/lbf1qlitk9ho",
"status": "ACTIVE"
}
~ $
5.まとめ
今回はClaude Sonnet 4.5を単一リージョンで動作させようとした失敗談となります。
結論としては単一リージョンで動作させたいならサポートされているモデルを選ぶ必要があります。
結局のところ"サポートされていない"だけなのですが、個人的には仕様の勘違いにより混乱したものだったので、誰かの参考になると幸いです。
単一リージョンでの推論についても需要はあると思うのですが、Claude Sonnet 4.5においては日本に絞ったところまでが現状のようなので、今後のモデル提供状況の変化にも注目していこうと思います。

