前回の記事では、ChatGPTは文字数のカウントが苦手という課題を紹介しました。
本記事では、その弱点が OpenAIの最新oシリーズモデル「OpenAI o3-pro」 を使ったら改善されるのかを検証してみました。
前回の記事はコチラ ↓
※使用ツール:ChatGPT(GPT-4o、o3-proモデル)
※本記事の内容は、2025/6/17時点の仕様です。
「o3-pro」とは
o3-pro は、OpenAIが提供する「oシリーズ」の最新版です。
この「oシリーズ」は、複雑な推論を得意とし、応答の前により長く「考える」時間を取る設計のため、プログラミングや科学・数学などの高度な問題解決を必要とする分野に特化しています。深い思考を必要とする課題であれば GPT-4o より適切な回答を導きやすいのが特徴です。
検証方法
「GPT-4o」と「o3-pro」を使った場合でどのように違いが出るのか、比較検証してみました。以下のように、文字数だけを指定したプロンプト で比較をしてみます。
プロンプト例
織田信長について # 文字数 で説明してください。
・テキストのみで直接出力してください。
・マークダウンにはしないでください
# 文字数
・下限:400文字
・上限:500文字
実行結果
モデル | GPT-4o | o3-pro |
---|---|---|
文字数 | 345文字 | 442文字 |
o3-proは指示通り 400〜500 文字の範囲内に収まり、自己カウントも正確でした。一方、GPT‑4o は下限を大きく下回る結果となりました。
生成プロセス
また、「o3-pro」モデルでは、生成プロセスが簡潔に可視化され、モデル内部での推論工程が確認できます(下図参照)。以前の o1 世代ではずらずらとプロセスが記述されていましたが、現在ではかなりシンプルになっています。
活用シーンと使い分け
以下のように、目的に応じたモデル選択が推奨されます。
シーン | 推奨モデル | 理由 |
---|---|---|
SNS投稿・メール件名など 厳密な文字数制限 がある原稿 | o3‑pro | カウント精度が高い |
数式導出・プログラムの設計レビューなど 深い推論が必要 な場面 | o3‑pro | 長考設計により誤答率が低い |
チャットサポート・即時回答が必要な 日常タスク | GPT‑4o | 応答速度が速い |
まとめ
「o3-pro」は、深い思考プロセスを経て結果を生成するモデルです。「GPT-4o」と比較すると、文字数制御の精度が大幅に向上しており、文字数制御が必要な文章生成(広告、文字数制限のあるSNS投稿、自動原稿生成など)で大きな効果が期待できそうだと思いました。
ただ、1回のプロンプトで最低でも1分程度、内容によっては5分以上出力に時間がかかるため、毎回「o3-pro」を使うと時間がかかりすぎてしまうという難点もあります。
より効率よく便利に活用するためにも、AIが苦手とする分野や、高度なことを求める場合は「o3-pro」、日常タスクなどの簡単なことは「GPT-4o」というように、うまく使い分けてあげてください!
最後に
テンダでは、「こんなプロジェクトに挑戦したい」「こんなチームで働きたい」「理想のチームを創りたい」と願う仲間を求めています。
カジュアル面談も随時受付中です。ぜひ一度お話ししましょう!