0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Vertex AI Agent Engine でデプロイ時にリソース制御の設定を行う

0
Posted at

はじめに

Vertex AI Agent Engineでは、デプロイしたAIエージェントのコンテナに割り当てるリソースを簡単に設定することができます。
デプロイ後にGCPの画面上から設定することもできるのですが、デプロイ時に設定したかったので、調べてみました。

Vertex AI Agent Engineのリソース制御

Vertex AI Agent EngineにデプロイしたAIエージェントは、スケーリングの上限や各コンテナのスペックの割り当てを決めることができます。

image.png

各リソースの詳細は以下。
2026年3月22日現在、ドキュメントにはプレビューとあるので、GAはまだのようです。

デプロイ時に設定する

WebUI上からも設定ができるのですが、どうせならデプロイ時に設定したいのでやっていきましょう。

基本的には以下の記事で作成したスクリプトを使います。

差分は以下の部分です。

remote_app = agent_engines.create(
    app,
    requirements=[
        "google-adk",
        "llama-index",
    ],
    extra_packages=[
        "./ragagent",
    ],
    # リソース制御の設定を追加
    min_instances=1,
    max_instances=1,
    resource_limits={
        "cpu": "2",
        "memory": "4Gi",
    },
    container_concurrency=9,
)

これでデプロイすると、指定した値が初期から入ってるようになりました!

image.png

おわりに

リソース制御をWebUI上から行うと反映までタイムラグがありました。
デプロイ時に指定できるようになることで不要な手順が減って嬉しいですね。

余談ですが、リソース制御がVertex AI for SDKに入ったのは2025年8月のリリースのようです。そろそろGAしてくれたらうれしいですね、楽しみに待とうと思います。

ここまでご覧いただきありがとうございました!

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?