こんにちは!ひさふるです。
さきほど、ついにGPT-5が登場しました。待望のリリースといった感じですね。
これまでOpenAIは、GPT-5はGPT-4と比較しても大幅に性能が向上すると何度も言及しており、その性能には大きく期待が寄せられていました。
今回、さっそくCursor上でモデルとして選択できるようになっていたため、簡易的なレビューをしてみました。
GPT-5とは?
もはや説明不要ですが、おさらいとして。
GPT-5は、OpenAIが開発したLLMである"GPT"シリーズの最新版です。
特徴として過去最高レベルの"頭の良さ"があり、数学や医療など様々な専門分野で、まるで専門家のような深い洞察ができることが謳われています。
リアルタイムルーター
GPT-5は動作の"速いスマートで効率的なモデル"と、難しい問題に対処するための"深い推論モデル"を備えており、どちらを使うかを動的に判断して切り替えているようです。
これを、"リアルタイムルーター"と表現しています。
今までも似たような機能は他のプロダクトで実装されてきたように思えますが、単一のモデルとして提供されるのは非常に便利になったように思えます。
私はよく、動作の速いGPT-4oと、遅いけど頭の良いo3のどちらに質問しようか悩むことが多いのですが、その判断が要らなくなると考えると便利そうですね。
コーディング性能
GPT-5の特徴として、コーディング性能も強調されています。
具体的にはフロントエンドの実装能力の向上が上げられており、見た目がキレイかつレスポンスなWebサイトを数行のプロンプトから生み出すことができるとされています。
モデルの種類
APIとしては、以下の3種類が提供されるようです。
- gpt-5
- コーディングやエージェント実行など複雑なタスク向け
- 料金(Input):$1.25
- 料金(Output):$10.00
- gpt-5-mini
- 高速かつ低コストで、より良い質のアウトプットを得たい場合
- 料金(Input):$0.25
- 料金(Output):$2.00
- gpt-5-nano
- 最も高速かつ低コストなモデル
- 料金(Input):$0.05
- 料金(Output):$0.40
通常のgpt-5に加え、miniとnano版も提供されるようですね。よくOpenAIのAPIを使って個人開発をしている私のような開発者にとっては嬉しい限りです。
ちなみに値段ですが、gpt-4oがInput $2.50, Output $10.00であることを考えると全然高く無いですね。
今後、主流はgpt-5になると思うので、もしかしたら従来のモデルは値下げされるかもしれません。
その他発表内容について
同じ職場の@naopenさんが発表内容についての記事を出していました。
詳しい発表内容はぜひこちらをご覧ください🙇
GPT-5を試す①:会社のホームページ作成
さっそく、Cursorに上でモデルの選択ができるようになっていたため、簡単なタスクをいくつか実行させてみて、GPT-4との性能の比較をしてみました!
(私が記事を書いた時点ではGithub上でGPT-5を有効化してもGitHub Copilot上では選択できませんでした。まあそのうち選択できるようになるでしょう。)
今回は、次のようなプロンプトを投げて、作成されるもののクオリティを比較してみます。
自分で言うのもなんですが、まあ酷いプロンプトですね笑
次のようなLPを実装してください。
IT企業"KDDIアジャイル開発センター"の紹介ページ。白と青を基調として、会社の紹介や採用ページなどを作ってほしい。
そのまま公開しても良いように、デザインと内容にこだわって作ってほしい。
※テストとして私の所属する企業のHPを作成させていますが、ここで作成された画像中の情報は実際の情報と異なることをご了承ください。
GPT-4の結果
まずGPT-4に作成させた結果から。上記のプロンプトを投げると、index.htmlが1つだけ生成されました。
開いてみるとこのような結果に。ちょっとシンプルすぎますね。
GPT-5の結果
それでは、待ちに待ったGPT-5の結果です。
全く同じプロンプトを投げたところ、最初からこのような構成でファイルが作成されました。
開いてみるとこのような結果に。
一部ロゴなどが文字列になっている問題はありますが、とても良いのでは無いでしょうか!
基本的な構成要素はGPT-4と同じですが、置かれているグラフィックなどの質が良いですね。
結果の比較
GPT-5は一発で、かつ適切なファイル分割がされた上で非常に高いクオリティの生成物が出せるという結果になりました。
生成物のクオリティもそうですが、全体的な開発体験も含めGPT-5の方が圧倒的に良いと言わざるを得ません。
| モデル | GPT-5 | GPT-4 |
|---|---|---|
| 生成されたもの | ![]() |
![]() |
| 備考 | 一発出しかつ、適切なファイル分割あり。 | 最初に定義されたToDoを繰り返して実装されたもの。index.htmlにすべて記述。 |
今後は、開発の主流はGPT-5になりそうですね。
(個人的にはいつも開発にClaude Codeを使用しているのですが、こっちでもGPT-5を使いたいなぁ...)
GPT-5を試す②:ゲーム作成
続いて、Pythonを使ってゲームを作ってもらいましょう。次のようなプロンプトを入力してみました。
Pythonで、pygameを使って次のようなゲームを作成してください。
横スクロールアクションゲームで、ステージは4つ。ジャンプを主体としたアクションが特徴で、各ステージの最後にはボスが登場する。キャラクターは可愛らしい見た目で、低年齢層でもプレイできる内容が望ましい。
GPT-4の結果
プロンプト入力後、main.pyのみが生成されました。
実行してみるとよくわからない画面が生成された後...
ボタンを押すとクラッシュしました...
エラー内容を渡して修正させてみます。一応、動くようにはなりました。
GPT-5の結果
それでは、GPT-5の結果です。
同じプロンプトを与えると、main.pyのほかREADME.mdやrequirements.txtもしっかり作ってくれました。
作成されたプログラムを起動してみると...
この時点で完成度がレベチです。
プレイしてみた様子がコチラです。
まだ粗はあるものの、指示をしっかりと汲み取りゲームとして最低限の要素は確実に実装されています。
結果の比較
これはもう明確にGPT-5の圧勝ですね。
おそらく、GPT-4でも細かくこちらで指示を出していけば、このレベルまでの作り込むことはそこまで難しくないかもしれません。
しかし、GPT-5はこちらがやって欲しいことを想像し、最初から高クオリティのものを出せるという点がGPT-4と比べて圧倒的に良いですね。
| モデル | GPT-5 | GPT-4 |
|---|---|---|
| 生成されたもの | ![]() |
![]() |
余談:正直な感想
現時点で、SNSでは「全然AGIレベルじゃないじゃん!」みたいな感想をちらほら見かけます。
※AGI(Artificial General Intelligence、汎用人工知能):様々なタスクを汎用的にこなせるAIで、特に人間の能力を超越しためちゃくちゃすごいAIみたいなニュアンスが強い。
私も使ってみてコーディング能力自体は凄いな、と思いつつ、当初想定していたほどの驚異的な変化は感じられないというのが現状です。
これは3つの理由があると思っています。
- GPT-5の凄さを体験できるようなタスクを与えられていない説
- GPT-5は"博士レベル"と形容されるような頭脳を持つとされていますが、その能力を十二分に発揮できるような難しいタスクを与えられている気がしません
- また、既に私よりは全然頭が良いので、自分より頭の良い人の評価が難しいという問題もあると思っています。
- ツールとして発展が追いついていない説
- GPT-5はポテンシャルとしては素晴らしい能力を秘めているものの、AGIとしての凄さを実感するには与えられているツールが足りないのでは?という説です
- 要は、MCPなどの形式で様々なツールを与えてできることを増やすことで、GPT-5としても飛躍的に真価を発揮しやすくなるのでは?と思っています
- ちょっと期待を上げすぎた説
- OpenAIはこれまで、GPT-5は今までのモデルと比較にならないほどの性能になると説明してきました
- 私達がその凄さを理解できていないという理由もありそうな一方で、ちょっと期待感を煽りすぎたのでは?という気もしなくはないですね
実際、本当に凄いモデルなのは間違い無さそうなので、個人的には斜に構えずどんどん利用しようとは思っています。
とはいえ、この先詳しい性能評価が出揃ってくるとは思うので、そのときに再度評価を行いたいですね。
おわりに
今回は、新しく登場したGPT-5のレビューを行ってみました。
簡単な比較のみでしたが、十分にGPT-5の凄さを体感することができました。
今後は確実に、AIコーディングエージェントの基盤モデルとなっていくことが予想されます。
昨今のAIコーディングエージェントの情勢はClaude Codeの登場で大きく変化していましたが、GPT-5の登場で更に大きく変化することが予想されますね。
ここまで読んでいただきありがとうございました。
参考文献









