OpenAI Agents SDK アップデート解説:サンドボックス実行とモデルネイティブハーネスで何が変わったのか
はじめに
AIエージェントという言葉が急速に普及する一方で、「試作品として動かすことはできても、本番環境で安全に動かすのが難しい」という壁に直面した方も多いのではないでしょうか。ファイルの読み書き、コードの実行、複数ステップにわたるタスクの継続——こういった処理を外部サービスと連携しながら安全に動かすには、モデルを呼ぶだけでは足りず、実行環境の設計まで自前で整える必要がありました。
OpenAIは2026年4月、Agents SDKの大幅なアップデートを発表しました。今回の目玉は「ネイティブサンドボックス実行」と「モデルネイティブハーネス」の2つです。簡単にいうと、エージェントが安全に・長時間・確実に動き続けるための実行基盤が、SDKに標準搭載されました。
この記事では、今回のアップデートで具体的に何が変わったのかを整理しながら、Agents SDKの新しい姿を解説していきます。
1. Agents SDK とは:おさらい
OpenAI Agents SDKは、AIエージェントを構築するためのPythonフレームワークです。以前は「Swarm」という名前で実験的に提供されていたものを本番向けに作り直したもので、2025年3月に公開されました。
このSDKの特徴は、少ない抽象化レイヤーでシンプルにエージェントを組める点にあります。主な構成要素は「エージェント(指示とツールを持つLLM)」「ハンドオフ(エージェント間の委譲)」「ガードレール(入出力の検証)」の3つで、複雑なマルチエージェントの処理もPythonのコードで素直に表現できます。
ただ、公開当初のSDKはチャットボット的な用途に近い設計でした。OpenAIのSteve Coffeyによれば、「当初のSDKは本質的にチャットボットのユースケース向けに構築されたもの」だったといいます。現在のモデルは数時間、場合によっては数日にわたって自律的に動き続けられるため、そうした長時間・複雑タスクに対応できる実行基盤が必要になってきました。今回のアップデートはその答えともいえます。
2. 今回のアップデートで何が変わったか
2.1 モデルネイティブハーネス
「ハーネス」とは、モデルを取り巻く実行環境のことです。ツールの呼び出し方、ファイルへのアクセス方法、メモリの扱いなど、エージェントが動くための仕組み全体を指します。
今回のアップデートで、このハーネスがOpenAIのフロンティアモデルに最適化された形になりました。具体的には、MCP(Model Context Protocol)によるツール呼び出し、apply_patchによるファイル編集、シェルコードの実行、AGENTS.mdによるカスタム指示など、エージェントシステムで共通的に使われるプリミティブが標準で統合されています。
加えて、設定可能なメモリ、サンドボックスを意識したオーケストレーション、マルチエージェントの協調実行なども含まれており、開発者がドメイン固有のロジックに集中できるよう、コアインフラの整備をSDK側で引き受ける設計になっています。
2.2 ネイティブサンドボックス実行
今回のアップデートで最も大きな変化のひとつが、サンドボックスのネイティブサポートです。
サンドボックスとは、エージェントが動作する隔離されたコンピュータ環境のことです。これまでは、エージェントにファイルを読み書きさせたりコードを実行させたりするために、開発者が自前で実行環境を用意する必要がありました。今回のアップデートでは、そのレイヤーがSDKに組み込まれています。
SandboxAgentというクラスを使うと、エージェントは専用のワークスペースを持ち、その中でファイル操作やコマンド実行、依存パッケージのインストールを安全に行えるようになります。ワークスペースの構成は「Manifest」という抽象化レイヤーで定義でき、ローカルファイルやGitリポジトリ、クラウドストレージ(AWS S3、Google Cloud Storage、Azure Blob Storageなど)をマウントすることも可能です。
from agents.sandbox import SandboxAgent, Manifest, LocalDir
agent = SandboxAgent(
name="analyst",
instructions="提供されたファイルを分析してください",
default_manifest=Manifest(entries=[LocalDir(path="./data")])
)
このコードは、./dataディレクトリをワークスペースとしてエージェントに渡す最小限の例です。実際の処理はサンドボックス内で完結するため、ホストシステムへの影響を心配せずに動かせます。
2.3 耐久性のある実行(Durable Execution)
長時間タスクにおいて見落とされがちな課題が、「途中でコンテナが落ちたらどうなるか」という問題です。
今回のアップデートでは、スナップショットとリハイドレーション(状態の復元)の仕組みが導入されました。エージェントの状態を外部に保存しておくことで、サンドボックスのコンテナが失敗・期限切れになっても、新しいコンテナで前回のチェックポイントから処理を再開できます。
さらに、スケーラビリティの面でも改善があります。1つのエージェント実行で複数のサンドボックスを使い分けたり、サブエージェントをそれぞれ隔離された環境にルーティングしたり、並列処理でタスクを高速化したりすることが可能になりました。
2.4 対応サンドボックスプロバイダー
サンドボックスは自前のコンテナインフラを使うこともできますし、以下のプロバイダーとの統合も標準でサポートされています。
| プロバイダー | 概要 | 特徴 | 備考 |
|---|---|---|---|
| Blaxel | エージェント向けクラウド実行環境 | エージェントワークロードに特化 | - |
| Cloudflare | CDN・エッジコンピューティング基盤 | エッジでの分散実行が可能 | Workers環境を利用 |
| Daytona | セキュアな開発環境プラットフォーム | コード実行の隔離に強み | オープンソース系 |
| E2B | AI向けサンドボックス実行サービス | AI開発者向けに設計 | Python/JSに対応 |
| Modal | クラウド関数・コンテナ実行基盤 | スケーリングが柔軟 | GPU対応あり |
| Runloop | エージェント向けインフラ | 長時間タスクの耐久実行に対応 | - |
| Vercel | フロントエンド・サーバーレス基盤 | デプロイの手軽さが特徴 | Sandbox機能を提供 |
どのプロバイダーを選んでも、Manifestによるワークスペース定義はポータブルなので、環境を切り替えても設定を大きく変える必要はありません。
3. セキュリティ面での意義
エージェントを本番環境に導入しようとすると、必ずセキュリティの懸念が生まれます。「APIキーが漏れないか」「意図しないネットワーク通信が起きないか」「ホストシステムのファイルに悪影響を与えないか」——こういった不安は、特に業務での利用を検討する際に大きな障壁になります。
今回のアップデートでは、ハーネスとコンピューティング層を分離する設計が採用されています。サンドボックス内にAPIキーやシークレットを持ち込まない構成が可能で、ネットワークアクセスもプロバイダーの設定で制限できます。プロンプトインジェクション対策やデータ漏洩の防止にも、この分離設計が効いてきます。
個人の実験プロジェクトでは安全性にそこまで気を使わなくていいかもしれませんが、業務データを扱うシステムへ組み込む場合は、こうした実行環境の分離は欠かせません。その仕組みがSDKに最初から用意されているのは、実際に導入を検討する立場からすると大きな安心感があります。
4. 実際に使い始めるには
現時点では、今回の新機能(サンドボックスエージェントとハーネス)はPython向けにリリースされています。TypeScriptのサポートは今後提供予定で、コードモードやサブエージェントなどの追加機能も開発中とのことです。
まずは既存のAgents SDKをインストールして、サンドボックスエージェントのクイックスタートから試してみるのが最短ルートでしょう。
pip install openai-agents
インストール後は、公式ドキュメントのSandbox agents quickstartに沿って進めると、最小限のコードで動作を確認できます。新機能はOpenAI APIを通じてすべての顧客に提供されており、料金はトークンとツール利用に基づく通常の標準価格が適用されます。
まとめ
今回のOpenAI Agents SDKのアップデートは、エージェント開発における「最後の一歩」を大きく埋めてくれる内容でした。
ネイティブサンドボックス実行とモデルネイティブハーネスの組み合わせにより、ファイル操作・コード実行・長時間タスクの継続といった処理が、SDKの標準機能として利用できるようになりました。スナップショットによる耐久実行、複数のサンドボックスプロバイダーへの対応、セキュリティを意識した分離設計——これらがそろったことで、プロトタイプ段階で止まっていたエージェント開発を、より現実的な形で前に進めやすくなったといえます。
まとめると、今回のポイントは次のとおりです。
- サンドボックスがSDKにネイティブ統合され、隔離された安全な実行環境が標準で使えるようになった
- モデルネイティブハーネスにより、フロンティアモデルの能力を引き出しやすい実行基盤が整備された
- スナップショットとリハイドレーションで、長時間タスクの途中失敗に対する耐性が高まった
- Blaxel・Cloudflare・E2Bなど複数のプロバイダーと統合でき、自前のコンテナ環境も使える
まずはPython環境でサンドボックスエージェントを動かしてみて、どんな可能性が広がるか実際に体感してみてください。
この記事がどなたかのお役に立てれば幸いです。