About GPT-5.2
GPT-5.2 は、OpenAI が 2025年12月11日に公開した最新の GPT-5 系モデルで、長時間稼働するエージェント用途や高度な知識業務を想定して設計されたフロンティアモデルです。
汎用的な推論能力、長文コンテキスト理解、ツール活用、視覚処理などが大幅に向上しており、実世界の複雑なタスクをより安定してこなせるようになりました。
GPT-5.2 シリーズ(Instant、Thinking、Pro)の中でも特に GPT-5.2 Thinking は、知識業務ベンチマーク(GDPval)において複数の専門領域で 「業界専門家レベルの性能」 を示した初のモデルとされています。
GPT-5.2の主な用途
- 専門的な知識業務(文書・資料作成)
- スプレッドシート、レポート、プレゼン、業務文書などの作成を高速化します。
GPT-5.2 Thinking は評価環境下で 専門家レベルの品質を、より低コストかつ高速で実行可能 であることが示されています。
- スプレッドシート、レポート、プレゼン、業務文書などの作成を高速化します。
- 高度なコーディング・開発支援
- 実世界のソフトウェアメンテナンスタスクを評価する SWE-Bench Pro で、GPT-5 系モデルとして最高水準のスコアを達成。
フロントエンド作業、3D UI、リファクタリング、バグ修正など、エージェント主導のコーディング性能が向上しており、Windsurf などのツールでも採用されています。
- 実世界のソフトウェアメンテナンスタスクを評価する SWE-Bench Pro で、GPT-5 系モデルとして最高水準のスコアを達成。
- 長文コンテキストの分析
- 最大 256k トークン の長文処理が可能で、MRCRv2 などのベンチマークで高精度を示しています。
契約書、研究論文、複数ファイルにまたがるプロジェクト管理など、大規模情報の分析に適しています。
- 最大 256k トークン の長文処理が可能で、MRCRv2 などのベンチマークで高精度を示しています。
- 複雑なワークフローの自律実行(エージェント)
- 複数ステップやツール利用が必要なタスク(例:遅延フライトの再予約、ホテル手配、医療手続きなど)を エンドツーエンドで継続的に処理 できます。
- 科学・数学研究の支援
- 数学ベンチマーク(FrontierMath)や科学QA(GPQA Diamond)で、GPT-5 系として最高レベルのスコアを記録。
研究支援用途にも活用できます。
- 数学ベンチマーク(FrontierMath)や科学QA(GPQA Diamond)で、GPT-5 系として最高レベルのスコアを記録。
リファレンス
公式サイト: GPT-5.2 が登場 | OpenAI
APIドキュメント: API Platform
関連タグ
User Rankings
Weekly
Monthly
Yearly
Organizations ranking
Monthly
All