1. ChatGPTが“エージェント”へ進化
2025年7月17日、OpenAIは「ChatGPT Agent」を正式リリースしました。
これは、従来のチャット型AIから一歩進み、ウェブ操作・ファイル作成・リサーチ・コーディングなどを自主的に実行できる「汎用AIエージェント」です。
主な特徴
-
統合ツール
Operator(ウェブ操作)とDeep Research(リサーチエージェント)を統合。 -
自律的な操作実行
単なる回答だけでなく、操作・実行をエージェントが自動判断。 -
複数ステップ実行
ブラウザ、ターミナル、API、ファイル生成を組み合わせたタスクも可能。
参考:The Verge
2. 対応ユーザー・提供地域・利用制限
対象プラン
プラン | エージェント利用可否 | 月間上限 | 月額 |
---|---|---|---|
Pro | ○ | 400件 | 200ドル |
Plus | ○ | 40件 | 20ドル |
Team | ○ | 30クレジット | 30ドル |
- Enterprise/Education:夏以降に展開予定
- 提供地域:世界中(ただし、EUとスイスは調整中)
参考:The Verge
3. 主な機能と使用用途
3.1 ウェブ操作(Operator機能)
-
操作内容
- フォーム入力
- ボタンクリック
- オンライン注文・予約代行
-
動作制御
- Watch Mode搭載(高リスクサイトでは即停止)
参考:Operator解説
3.2 Deep Research
-
調査方法
- 数百サイトから自動調査
- 出典付きレポート出力
-
性能指標
- Humanity’s Last Exam(HLE):26.6%
-
使用モデル
- GPT-4ではなくGPT o3特化モデルを使用
3.3 ターミナル操作&ファイル生成
-
仮想ターミナル操作
- Python / Shell コマンド実行
-
ファイル生成
- LibreOfficeベースでスプレッドシート・プレゼン資料作成
-
性能指標
- SpreadsheetBenchでCopilot(20.0%)を大きく上回る45.5%の精度
参考:Tom's Guide
3.4 Web・API・コネクタ連携
-
接続可能サービス
- Gmail / Google Calendar / GitHub / Google Drive / SharePoint
-
注意点
- 読み取り専用(操作は手動操作で実行)
3.5 反復・定期実行機能(Recurring Tasks)
-
例
- 毎週月曜に定期レポート生成
-
通知
- 定期実行完了時はChatGPTアプリから通知
4. 安全策・プライバシー対策
-
ユーザー承認制
- メール送信や予約には必ず確認プロンプト
-
Watch Mode
- 金融・メールなどはユーザーが画面を閉じると即停止
-
プロンプトインジェクション対策
- モニタリング&検出パイプライン強化
-
生物化学リスク対応
- Preparedness Framework準拠
-
データ保護
- コネクタは「読み取り専用」。書き込みは手動実行
Preparedness Frameworkは、AIモデルのリスクを専門チームが「説得力」「セキュリティ」「有害物質」「自律性」の4分野で評価し、安全に開発・導入できるかどうかを判断する仕組みです。リスクが高い場合は、安全諮問グループが軽減策を検討・助言します。
5. 実際の使用用途例
-
デートプラン自動設計
Google Calendarから空き時間を取得し、OpenTableで予約&メニュー選定。 -
プレゼン資料作成
財務データ分析 → Excel・スライド生成。 -
オンライン買い物代行
レシピから食材リストを作り、オンライン注文。 -
披露宴総合手配
指輪購入・旅程調整・ギフト選定まで実行。 -
定期レポート自動生成
毎週の業績まとめを自動生成してSlack通知。
ChatGPTエージェントの使用例を見ると分かるように、これは単なるチャットボットではなく、ユーザーの意図を深く理解し、複数の外部サービスを連携して“実行”まで担うパーソナルAIとして進化しています。
他のAIエージェントと比較しても、特定用途の自動化だけに留まらず、カレンダー、プレゼン、買い物、ギフト、通知といった日常業務や生活設計を広くカバーしている点が際立っています。
また、実用性の高い機能が丁寧に組み込まれており、「人間の補助者」というポジションから「実行代理人」へと役割が広がっている印象ですね。
実用性と直感性が両立されたこの設計思想は、まさに新世代AIの象徴とも言えるかもしれません。
8. 今後のロードマップ
- Enterprise/Education提供:夏~秋に展開予定
- GPT-5との統合:今後、Agent機能はGPT-5に組込予定
- ユーザー記憶(Memory)との連携:将来的に対応
- マルチモーダル対応:音声・専用デバイス展開も検討
- コスト最適化:高負荷運用に合わせた価格改定も視野