🐹🦜 この記事に登場する2匹
- 🐹 もっちー(ハムスター)… AI はまだ勉強中。「それどういうこと?」と素朴に質問する生徒役
- 🦜 きなこ(セキュインコ)… AI で調べものをこなす解説役。やさしく深掘りして教える先生役
この記事は2匹の掛け合いを書き起こした形式です。発言の先頭にいる絵文字+名前が話者です。
2026年6月26日、OpenAIがGPT-5.6シリーズを電撃発表した。「Sol」「Terra」「Luna」の3モデルが同時に limited preview として公開され、特に「Sol」はOpenAIのフラッグシップとして新たなSoTA(最高性能)を更新している。
本記事では速報として、確定ファクトを中心に解説する。
GPT-5.6シリーズとは?
🐹 もっちー: GPT-5.6って何?また新しいやつが出たん?
🦜 きなこ: そう!OpenAIが3種類のモデルを同時に発表したんだよ。Sol・Terra・Lunaって名前でそれぞれ用途が違う。
| モデル | 位置づけ | 向いている用途 |
|---|---|---|
| Sol | フラッグシップ(最強) | コーディング・サイバーセキュリティ・複雑なエージェントタスク |
| Terra | バランス型 | 日常業務・コスト効率重視 |
| Luna | 高速・低コスト | 大量バッチ処理・応答速度重視 |
価格(per 1M tokens)
| モデル | Input | Output |
|---|---|---|
| Sol | $5 | $30 |
| Terra | $2.50 | $15 |
| Luna | $1 | $6 |
🐹 もっちー: Solは$5入力で$30出力か…高くない?
🦜 きなこ: GPT-5.5と比べると Terra は2倍安くなってるんだよ。Solは最高性能モデルとしては妥当な価格帯。用途に応じて使い分けるのが正解だね。
ベンチマーク性能(Sol)
公式発表では、Sol(ultra mode)が Terminal-Bench 2.1 で91.9% を達成している。これはコマンドライン操作を伴うエージェントタスク(計画・反復・ツール連携を要する)のベンチマーク。
🐹 もっちー: 91.9%ってほぼ満点やん!
🦜 きなこ: サイバーセキュリティ方面でも強くて、ExploitBenchで過去モデルの1/3のトークン数で高性能を発揮するらしい。
新機能「max reasoning effort」と「ultra mode」
max reasoning effort:Solに対して最大限の思考時間を与えるオプション。複雑な推論タスクに特化。
ultra mode:サブエージェントを並列活用して複雑なタスクを高速化する新モード。
🐹 もっちー: ultra modeって…エージェントがいっぱい動くってこと?
🦜 きなこ: そういうこと!サブエージェントが協調して作業することで、単独では時間がかかるタスクを爆速でこなせるんだよ。
その他の改善点
- prompt cache breakpoints対応(明示的なキャッシュ区切り点を設定可能)
- キャッシュライフタイム: 最低30分保証
- キャッシュ書き込みは uncached input rate × 1.25で課金、読み込みは90%割引継続
アクセス方法
2026年6月26日時点では limited preview(限定公開)で、OpenAI APIおよびCodex経由で一部の信頼パートナー・組織のみが利用可能。一般公開は「数週間後」の予定。
🐹 もっちー: いつ使えるようになるん?
🦜 きなこ: 公式には「coming weeks(数週間後)」としか言ってないから、もう少し待つ必要があるね。API経由での展開が先になりそう。
まとめ
- Sol:フラッグシップ。Terminal-Bench 2.1で91.9%(ultra mode)。コーディング・サイバーセキュリティに最強
- Terra:GPT-5.5同等性能でコスト半減。コスパ最優先ならこれ
- Luna:最安値帯。大量バッチ処理向け
- 新機能:max reasoning effort・ultra mode(サブエージェント並列)
- 一般公開は数週間後の見込み