0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

GPT-5.4は「よく答えるAI」より「ちゃんと作業するAI」として出てきた

0
Posted at

アップロード容量が月の制限(100MB)を超えました。設定 -> アップロードしたファイル から、当月にアップロードされた不要なファイルの削除を行ってください。

まず最初に感じたこと

正直、今回のGPT-5.4は「また少し賢くなった新モデル」くらいの話ではないと思う。

本丸は、AIが実務を最後まで進める方向にかなり寄ったことだ。ChatGPTではGPT-5.4 Thinkingとして、APIとCodexでも同日に公開され、さらに重い仕事向けのGPT-5.4 Proも出ている。 オープンAI+1

75%のコンピュータ操作、100万トークン、Pro同時公開。

この一文だけでも空気が変わったのは伝わる。

しかも今回は、単なる宣伝文句ではなく、コンピュータ操作そのものや長文処理、ツール連携まで含めて「仕事を進める能力」を前面に出してきた。ここがかなり大きい。 オープンAI


何がそんなに変わったのか

まず分かりやすいのが、ネイティブなコンピュータ操作だ。GPT-5.4は、OpenAIいわく初の汎用モデルとしてネイティブなcomputer use(画面を見て、クリックやキーボード操作を伴う作業)を持っていて、アプリをまたぐ複雑なワークフローをこなせるように設計されている。OSWorld-Verifiedでは75.0%で、人間の72.4%も上回った。 オープンAI

次に効くのが、100万トークン級の長文コンテキストだ。正確には1,050,000トークンのウィンドウがあり、出力は最大128,000トークン。巨大な仕様書、長い議事録、複数リポジトリのコード、設計資料の束をまとめて抱えたまま考えられる。これ、日常業務に入ると地味どころかかなり効く。 しかもGPT-5.4は、tool search(必要なツールを探して使う機能)も強化されていて、トークン効率もGPT-5.2より改善された。要するに、長い文脈を読めるだけでなく、必要な道具を見つけて、少ないトークンで最後まで走りやすくなったということだ。 オープンAI+1


だから重要なんだと思う

個人的には、今回いちばん効いているのは「チャットの出来」より「成果物の出来」だと思う。

GPT-5.4はGDPvalで83.0%と、GPT-5.2の70.9%を上回っている。さらに、スプレッドシート系の内部評価では87.3%、プレゼン評価ではGPT-5.2より68.0%の割合で好まれたとされている。つまり、返答が気の利いた文章になるだけじゃなく、表、資料、文書まで含めたアウトプットの完成度を押し上げてきた。 オープンAI

ここでの変化は「何を知っているか」より、「どこまでやり切れるか」に近い。

さらに面白いのが、OpenAI自身がGPT-5.4 Thinkingに「最初に作業方針を出す」挙動を入れてきたことだ。途中で方向修正しやすくなっていて、深いWeb調査でも文脈を保ちやすい。

これって、プロンプト一発で魔法みたいに当てる発想より、途中で共同作業しながら詰める前提に寄っている。かなり現実的だし、実務向きだ。 オープンAI


AI駆動開発の見え方も変わる

Cursor、 Code、GitHub Copilotみたいなツールを普段触っている人ほど、今回の変化は刺さるはずだ。

というのも、勝負が「補完が速い」「コードがうまい」だけではなく、調べる、整理する、ツールを呼ぶ、画面を操作する、成果物まで閉じるに移っているから。OpenAIがかなり露骨にその領域を取りに来た感じがある。 オープンAI+1

ここでエンジニアの価値が消えるかというと、僕はむしろ逆だと思う。

必要になるのは、良いコードを書く力だけじゃなく、どのツールを許可するか、完了条件をどう定義するか、失敗時にどこへ戻すかを設計する力だ。AIに何をさせるかより、どこまで任せて、どこで人が握るかの設計が仕事になる。これは結構はっきりしてきた。

技術スタック選定でも差が出る。GPT-5.4自体は入力$2.50、出力$15/100万トークンで、Proは入力$30、出力$180とかなり重い。しかもProはResponses API中心で、返答に数分かかることもある。

だからスタートアップや個人開発では、全部をProに載せるより、通常はGPT-5.4、難所だけPro、周辺は軽量モデルみたいな分離が現実的だと思う。 オープンAI+2OpenAI

自分ならどう見るか

正直、 系やCursor系を触っていると、「AIが開発の横にいる」感覚にはもう慣れてきた。

でもGPT-5.4で見えてきたのは、その次だ。横にいるAIではなく、自分の代わりにいくつかの工程を進めるAIになりつつある。

だから今後は、モデル名の強さ比較だけ追っても足りない。

どこまで長文を抱えられるか、どのツールに触れられるか、画面操作まで含めて閉じられるか、コストに見合うか。この4点で見るほうが、たぶん実務ではずっと役に立つ。

個人的には、今回のGPT-5.4は「Claude 4とどっちが強い?」みたいな話より、OpenAIが“作業を終わらせるAI”の路線をかなり鮮明にしたことのほうが重要だと思う。

ここが見えてくると、AI駆動開発の設計も、プロダクトの作り方も、だいぶ変わる。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?