はじめに
Vertex AI Agent Engineでは、デプロイしたAIエージェントのコンテナに割り当てるリソースを簡単に設定することができます。
デプロイ後にGCPの画面上から設定することもできるのですが、デプロイ時に設定したかったので、調べてみました。
Vertex AI Agent Engineのリソース制御
Vertex AI Agent EngineにデプロイしたAIエージェントは、スケーリングの上限や各コンテナのスペックの割り当てを決めることができます。
各リソースの詳細は以下。
2026年3月22日現在、ドキュメントにはプレビューとあるので、GAはまだのようです。
デプロイ時に設定する
WebUI上からも設定ができるのですが、どうせならデプロイ時に設定したいのでやっていきましょう。
基本的には以下の記事で作成したスクリプトを使います。
差分は以下の部分です。
remote_app = agent_engines.create(
app,
requirements=[
"google-adk",
"llama-index",
],
extra_packages=[
"./ragagent",
],
# リソース制御の設定を追加
min_instances=1,
max_instances=1,
resource_limits={
"cpu": "2",
"memory": "4Gi",
},
container_concurrency=9,
)
これでデプロイすると、指定した値が初期から入ってるようになりました!
おわりに
リソース制御をWebUI上から行うと反映までタイムラグがありました。
デプロイ時に指定できるようになることで不要な手順が減って嬉しいですね。
余談ですが、リソース制御がVertex AI for SDKに入ったのは2025年8月のリリースのようです。そろそろGAしてくれたらうれしいですね、楽しみに待とうと思います。
ここまでご覧いただきありがとうございました!

