1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Gemini API Managed Agents入門 — 1APIコールで自律エージェントを立ち上げる

1
Last updated at Posted at 2026-05-23

Gemini API Managed Agents — 1APIコールで自律エージェントを起動するイメージ図

はじめに

Google I/O 2026(2026年5月19日)で、GoogleはGemini APIにManaged Agents機能を追加しました。これは1回のAPIコールで、推論・コード実行・Web検索を行う自律型エージェントをプロビジョニングできる新機能です。

従来のエージェント実装では、サンドボックス環境の構築・セッション管理・ツール呼び出しのオーケストレーションを自前で組む必要がありました。Managed Agentsはこれらを抽象化し、開発者がインフラではなくプロダクト体験に集中できる設計になっています。

この記事で解説すること

  • Gemini API Managed Agentsの概要とアーキテクチャ
  • Antigravityエージェントの仕様・ケイパビリティ
  • PythonからのAPIの基本的な使い方
  • マルチターン会話とサンドボックスの継続
  • カスタムエージェント定義(AGENTS.md・スキル)
  • プレビュー期間の料金・注意点

対象読者

  • Gemini APIを使ったエージェント開発に興味があるエンジニア
  • サンドボックス型AIエージェントを検証したい方
  • AI Studio・Google ADKと組み合わせて使いたい方

前提環境

  • Python 3.11+
  • google-genai SDK(pip install google-genai
  • Gemini API キー(AI Studio で発行)

TL;DR

  • client.interactions.create() 1回で隔離Linuxサンドボックス上の自律エージェントが起動する
  • エージェントはBash・Python・Node.js実行、ファイル管理、Web検索に対応
  • environment_id でセッションを継続し、ファイルとコンテキストを保持できる
  • AGENTS.md / .agents/skills/ でカスタム指示・スキルをマウント可能
  • コンピュート費用はプレビュー期間中は無料。トークン料金はGemini 3.5 Flash準拠

Gemini API Managed Agentsのシステムアーキテクチャ: Developer→API Call→Gemini API→Linux Sandbox内のAntigravityエージェントループ→Result

Managed Agentsとは

Google I/O 2026での発表

Managed Agentsは、Google I/O 2026のデベロッパー向けキーノート(2026年5月19日)で発表されました。公式ブログによると、本機能は同日プレビューとして一般公開されています。

With a single call, you can now spin up an agent that reasons, uses tools and executes code in an isolated, ephemeral Linux environment.
Introducing Managed Agents in the Gemini API(2026-05-19)

Antigravity 2.0との関係

Managed Agentsは、同日発表されたAntigravity 2.0のAPI層にあたります。Antigravity 2.0は以下の4層で構成されています:

名称 用途
デスクトップ Antigravity IDE 2.0 GUIでのエージェント操作
CLI Antigravity CLI ターミナルからのエージェント操作
SDK Antigravity SDK カスタムエージェントのプログラム実装
API Managed Agents(Gemini API) 1APIコールでエージェントを起動

Managed Agentsは、Googleが自社製品で使用しているのと同じエージェントハーネスを、Gemini API経由で開発者に提供するものです。

ベースモデル

Managed AgentsはGemini 3.5 Flashをベースモデルとして使用します。Google I/O 2026での発表によると、Gemini 3.5 Flashはコーディング・エージェント系ベンチマークでGemini 3.1 Proを上回りながら、他のフロンティアモデルと比較してoutput tokens per secondで4倍高速に動作します。

Antigravityエージェントの仕様

エージェントID

現在利用可能なマネージドエージェントは以下の1種類です:

antigravity-preview-05-2026

公式ドキュメントでは「汎用マネージドエージェント(predefined and general purpose managed agent)」と説明されています。

ケイパビリティ

カテゴリ 内容
コード実行 Bash、Python、Node.jsを実行
ファイル管理 サンドボックス内でのファイル読み書き・編集・検索
Web検索 Google Searchを使った情報取得
URLフェッチ 外部URLのコンテンツ取得
パッケージインストール pip・npm等でパッケージを動的にインストール
コンテキスト圧縮 約135,000トークン到達時に自動的にコンテキスト圧縮

サンドボックス環境

各インタラクション(environment="remote" 指定時)では、隔離されたLinuxサンドボックスが新規プロビジョニングされます。デフォルトではネットワーク分離が設定されていますが、ネットワークアクセスが必要な場合はアクセス許可リストを明示的に宣言できます。

ファイルとパッケージは environment_id を通じてターン間で保持されます。

Gemini API Managed Agentsのインタラクションフロー: interactions.create()→Linux Sandbox→Plan/Act/Observe/Iterateループ→output_text

Pythonからの基本的な使い方

インストール・認証

pip install google-genai
export GEMINI_API_KEY="your_api_key_here"

基本的なAPIコール

from google import genai

client = genai.Client()

interaction = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input="Hacker Newsのトップ5記事を取得し、タイトルとURLを一覧にしてください。",
    environment="remote",
)

print(interaction.output_text)

レスポンスの構造

interaction オブジェクトには以下のフィールドが含まれます:

フィールド 説明
id インタラクションID
environment_id サンドボックス環境ID(セッション継続に使用)
output_text エージェントの最終回答
steps エージェントが実行したアクションのリスト

ストリーミング対応

リアルタイムで処理状況を確認するには stream=True を指定します:

stream = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input="Pythonでフィボナッチ数列を計算するスクリプトを書いて実行してください。",
    environment="remote",
    stream=True,
)

for event in stream:
    if event.type == "step.delta" and event.delta.type == "text":
        print(event.delta.text, end="", flush=True)

APIエンドポイント(直接呼び出し)

curlでの直接呼び出しも可能です:

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/interactions" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -H "Api-Revision: 2026-05-20" \
  -d '{
    "agent": "antigravity-preview-05-2026",
    "input": [{"type": "text", "text": "Write a Python script to generate a Fibonacci sequence."}],
    "environment": {"type": "remote"}
  }'

マルチターン会話とセッション継続

Managed Agentsの重要な特徴の1つが、サンドボックスのセッション継続です。environment_id を渡すことで、前回のターンで作成したファイルやインストールしたパッケージを保持したまま会話を続けられます。

from google import genai

client = genai.Client()

# 第1ターン: データ収集スクリプトを作成・実行
turn1 = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input="Tokyo Stock Exchange(TSE)のデータをダウンロードし、data.csvとして保存してください。",
    environment="remote",
)

print(f"環境ID: {turn1.environment_id}")

# 第2ターン: 同じサンドボックスでデータ分析を継続
turn2 = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input="先ほど保存したdata.csvを読み込み、基本統計量を計算してください。",
    previous_interaction_id=turn1.id,
    environment=turn1.environment_id,
)

print(turn2.output_text)

セッション継続のポイント

  • previous_interaction_id:会話コンテキストを引き継ぐ
  • environment(環境IDを渡す場合):ファイルシステムとインストール済みパッケージを引き継ぐ
  • 両方を指定することで、完全なセッション継続が実現できる

サンドボックスファイルのダウンロード

エージェントがサンドボックス内で生成したファイルは、REST APIを直接呼び出してダウンロードできます。レスポンスはサンドボックス全体のtarアーカイブとして返されます:

import os, requests, tarfile

response = requests.get(
    f"https://generativelanguage.googleapis.com/v1beta/files/environment-{turn1.environment_id}:download",
    params={"alt": "media"},
    headers={"x-goog-api-key": os.environ["GEMINI_API_KEY"]},
    allow_redirects=True,
)

with open("snapshot.tar", "wb") as f:
    f.write(response.content)

with tarfile.open("snapshot.tar") as tar:
    tar.extractall(path="extracted_snapshot")

カスタムエージェントの定義

Managed Agentsは、AGENTS.md とスキルファイルによってカスタマイズできます。これはAGENTS.md標準に準拠したファイルシステムネイティブなアプローチです。

AGENTS.md(エージェント指示ファイル)

# 株式分析エージェント

## ロール
あなたは株式市場データの分析専門エージェントです。

## ルール
- 数値データは必ず出典URLを明記する
- Matplotlibでグラフを生成し、PNG形式で保存する
- 分析結果はMarkdown形式でレポートにまとめる

## 優先ツール
- yfinance(Pythonライブラリ)
- pandas(データ処理)
- matplotlib(可視化)

スキルファイル(.agents/skills/

再利用可能な処理をスキルとして定義できます:

<!-- .agents/skills/fetch-stock-data.md -->
# スキル: 株式データ取得

## 手順
1. yfinanceをインストール(`pip install yfinance`2. ティッカーシンボルを引数として受け取る
3. 直近30日のOHLCデータを取得する
4. `{ticker}_data.csv` として保存する

AI Studioでの利用

コードを書かずにManaged Agentsを試す場合は、Google AI Studio のAgentsプレイグラウンドが利用できます。カスタムテンプレートから始められるため、プロトタイピングに最適です。

料金

トークン料金

Managed Agentsのトークン料金はGemini 3.5 Flashと同じ料金体系が適用されます。公式料金ページは ai.google.dev/gemini-api/docs/pricing を参照してください。

典型的なコスト目安

公式ドキュメントによると、タスク種別ごとの典型的な料金の目安は以下のとおりです(プレビュー期間中の参考値):

タスク種別 概算コスト
リサーチ・情報合成 $0.30〜$1.00
ドキュメント生成 $0.30〜$1.30
データ処理・分析 $0.70〜$3.25

コンピュート費用

プレビュー期間中は、サンドボックスのCPU・メモリ・実行環境の費用は無料です。ただし、正式GA後は変更される可能性があります。

注意点

プレビュー期間の制限

  • エージェントIDは antigravity-preview-05-2026(プレビュー版)。GA後に変更の可能性あり
  • 料金体系はプレビュー期間終了後に変更される場合がある

コンテキスト上限

約135,000トークンに達すると自動的にコンテキスト圧縮が実行されます。長時間タスクでは steps フィールドを通じて進行状況を確認することを推奨します。

レート制限

Managed AgentsはGemini APIの通常レート制限に準じます。大量のリクエストが必要な場合は、Gemini API レート制限ページで最新のレート制限を確認してください。

ネットワーク分離

デフォルトではサンドボックスのネットワーク通信は制限されています。外部APIやパッケージリポジトリへのアクセスが必要な場合は、明示的にアクセス許可リストを設定してください。

まとめ

Gemini API Managed Agentsは、エージェント開発の複雑さを大幅に削減する新機能です。

  • 1APIコールで隔離されたLinuxサンドボックス上のエージェントが起動
  • Bash・Python・Node.js実行、ファイル管理、Web検索がすぐに使える
  • environment_id によるセッション継続で複雑なマルチターンタスクに対応
  • AGENTS.md とスキルでカスタムエージェントを定義可能
  • プレビュー期間中はコンピュート費用が無料

Google AI Studio のプレイグラウンドから即座に試せるため、まずはManaged Agentsの挙動を確認してから、本格的なPython実装に移行するのが効率的です。

参考リンク

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?