GPT-5.4は「よく答えるAI」より「ちゃんと作業するAI」として出てきた

Posted at 2026-03-07

まず最初に感じたこと

正直、今回のGPT-5.4は「また少し賢くなった新モデル」くらいの話ではないと思う。

本丸は、AIが実務を最後まで進める方向にかなり寄ったことだ。ChatGPTではGPT-5.4 Thinkingとして、APIとCodexでも同日に公開され、さらに重い仕事向けのGPT-5.4 Proも出ている。オープンAI+1

75%のコンピュータ操作、100万トークン、Pro同時公開。

この一文だけでも空気が変わったのは伝わる。

しかも今回は、単なる宣伝文句ではなく、コンピュータ操作そのものや長文処理、ツール連携まで含めて「仕事を進める能力」を前面に出してきた。ここがかなり大きい。オープンAI

何がそんなに変わったのか

まず分かりやすいのが、ネイティブなコンピュータ操作だ。GPT-5.4は、OpenAIいわく初の汎用モデルとしてネイティブなcomputer use（画面を見て、クリックやキーボード操作を伴う作業）を持っていて、アプリをまたぐ複雑なワークフローをこなせるように設計されている。OSWorld-Verifiedでは75.0%で、人間の72.4%も上回った。オープンAI

次に効くのが、100万トークン級の長文コンテキストだ。正確には1,050,000トークンのウィンドウがあり、出力は最大128,000トークン。巨大な仕様書、長い議事録、複数リポジトリのコード、設計資料の束をまとめて抱えたまま考えられる。これ、日常業務に入ると地味どころかかなり効く。しかもGPT-5.4は、tool search（必要なツールを探して使う機能）も強化されていて、トークン効率もGPT-5.2より改善された。要するに、長い文脈を読めるだけでなく、必要な道具を見つけて、少ないトークンで最後まで走りやすくなったということだ。オープンAI+1

だから重要なんだと思う

個人的には、今回いちばん効いているのは「チャットの出来」より「成果物の出来」だと思う。

GPT-5.4はGDPvalで83.0%と、GPT-5.2の70.9%を上回っている。さらに、スプレッドシート系の内部評価では87.3%、プレゼン評価ではGPT-5.2より68.0%の割合で好まれたとされている。つまり、返答が気の利いた文章になるだけじゃなく、表、資料、文書まで含めたアウトプットの完成度を押し上げてきた。オープンAI

ここでの変化は「何を知っているか」より、「どこまでやり切れるか」に近い。

さらに面白いのが、OpenAI自身がGPT-5.4 Thinkingに「最初に作業方針を出す」挙動を入れてきたことだ。途中で方向修正しやすくなっていて、深いWeb調査でも文脈を保ちやすい。

これって、プロンプト一発で魔法みたいに当てる発想より、途中で共同作業しながら詰める前提に寄っている。かなり現実的だし、実務向きだ。オープンAI

AI駆動開発の見え方も変わる

Cursor、 Code、GitHub Copilotみたいなツールを普段触っている人ほど、今回の変化は刺さるはずだ。

というのも、勝負が「補完が速い」「コードがうまい」だけではなく、調べる、整理する、ツールを呼ぶ、画面を操作する、成果物まで閉じるに移っているから。OpenAIがかなり露骨にその領域を取りに来た感じがある。オープンAI+1

ここでエンジニアの価値が消えるかというと、僕はむしろ逆だと思う。

必要になるのは、良いコードを書く力だけじゃなく、どのツールを許可するか、完了条件をどう定義するか、失敗時にどこへ戻すかを設計する力だ。AIに何をさせるかより、どこまで任せて、どこで人が握るかの設計が仕事になる。これは結構はっきりしてきた。

技術スタック選定でも差が出る。GPT-5.4自体は入力$2.50、出力$15/100万トークンで、Proは入力$30、出力$180とかなり重い。しかもProはResponses API中心で、返答に数分かかることもある。

だからスタートアップや個人開発では、全部をProに載せるより、通常はGPT-5.4、難所だけPro、周辺は軽量モデルみたいな分離が現実的だと思う。オープンAI+2OpenAI

自分ならどう見るか

正直、系やCursor系を触っていると、「AIが開発の横にいる」感覚にはもう慣れてきた。

でもGPT-5.4で見えてきたのは、その次だ。横にいるAIではなく、自分の代わりにいくつかの工程を進めるAIになりつつある。

だから今後は、モデル名の強さ比較だけ追っても足りない。

どこまで長文を抱えられるか、どのツールに触れられるか、画面操作まで含めて閉じられるか、コストに見合うか。この4点で見るほうが、たぶん実務ではずっと役に立つ。

個人的には、今回のGPT-5.4は「Claude 4とどっちが強い？」みたいな話より、OpenAIが“作業を終わらせるAI”の路線をかなり鮮明にしたことのほうが重要だと思う。

ここが見えてくると、AI駆動開発の設計も、プロダクトの作り方も、だいぶ変わる。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up