3
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

o3と o4‑miniと o4‑mini‑highの違い

Posted at

以下では OpenAI が 2025 年 4 月に正式提供を始めた o‑series 最新モデルのスペック・料金・性能差・使い分けポイントを、公式ドキュメントと公開ベンチマークを基に整理します。


✨概要

OpenAI の o‑series は「じっくり考える(reasoning)」設計が特徴の高性能モデル群です。最上位 o3、高速・安価な o4‑mini、そして o4‑mini に“reasoning effort”を最大に振った o4‑mini‑high の3兄弟は いずれも20 万トークンの巨大コンテキスト に対応し、ツール呼び出し・ビジョン入力・Python実行など ChatGPT の全機能を利用できます【turn3search1】 (OpenAI's upgraded o3 model can use images when reasoning)。
違いは主に 推論品質 vs. 速度・コストのトレードオフ利用上限 にあります。本記事ではそれぞれの長所・短所と選び方を解説します。


🏗️ モデルの位置付け

項目 o3 o4‑mini o4‑mini‑high
設計思想 最高精度の reasoning 高速・低コスト mini を高推論モードで動作
context_window 200 k tokens 200 k tokens 200 k tokens
reasoning_effort デフォルト medium low high
代表的な用途 難度の高い数理・コード生成 大量バッチ処理、チャットボット 精度とコストの中間を狙う API 呼び出し

*context_window = 入力+出力合計の上限トークン数。


💸 料金と使用上限

API 料金(2025/04 時点、1M token あたり)

  • o3 : Input $10.00 / Output $40.00【turn2view0】
  • o4‑mini / o4‑mini‑high : Input $1.10 / Output $4.40【turn2view0】【turn5view0】

ChatGPT Plus/Team/Enterprise のメッセージ枠

  • o3 : 週 50 msg【turn7view0】
  • o4‑mini : 日 150 msg【turn7view0】
  • o4‑mini‑high : 日 50 msg【turn7view0】

⚡ 性能とベンチマーク

  • 数理系ベンチマーク (AIME 2024/25)
    o4‑mini > o3 > Gemini 2.5 Pro【turn0search3】
  • GPQA や MMMU など総合知識
    o3 が依然トップ、o4‑mini は僅差【turn0search3】
  • SWE‑bench (コード修正)
    o4‑mini が o3‑mini を上回り o3 に肉薄【turn1search6】
  • 推論速度 (出力速度)
    o3‑mini ≈ 179 tok/s【turn4search3】 → o3 より高速
    o4‑mini ≈ 72 tok/s【turn4search2】
    体感では mini の方が初速は速いが総トークン速度は遅め との報告も【turn4search4】
  • latency (TTFT)
    o3‑mini は 13.6 s、o4‑mini は 1.25 s 程度との外部計測【turn4search3】【turn4search7】

🔧 reasoning_effort と「‑high」の正体

o‑series では reasoning_effort パラメータで「考えるトークン数」を調整できます【turn6search0】。
OpenRouter のモデルカードによると o4‑mini‑high は o4‑mini に reasoning_effort=high を固定したプリセット名 で、料金は同一【turn5view0】。

  • 長所 : 複雑な課題で一段深い推論を試みる
  • 短所 : 出力速度がさらに低下、ChatGPT 枠も 50 msg/日に制限

🛠️ API 利用例

curl https://api.openai.com/v1/chat/completions \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
    "model": "o4-mini",
    "messages": [
      {"role":"system","content":"You are a concise assistant."},
      {"role":"user","content":"Explain LU decomposition in 3 bullet points."}
    ],
    "reasoning_effort": "high",   # o4-mini-high と同等
    "max_tokens": 512,
    "temperature": 0.4
  }'

reasoning_effort を明示すれば o4‑mini で “‑high” 相当の動作を得られます。逆に コスト最優先 なら low を指定してさらに高速化も可能です。


🎯 選び方の指針

シナリオ 推奨モデル
研究・専門職向け:厳密な数式証明、長大コードの改変 o3(高精度)
業務チャットボット/大規模バッチ:FAQ、RAG、大量議事録要約 o4‑mini(高コスパ)
エッジケース検証:o4‑mini で精度不足、o3 は高価 o4‑mini‑high または o4‑mini+reasoning_effort=high

📝 まとめ

  • o3 は最強精度と最大コスト。1 回の応答で何十万トークンを生成する“長距離走者”。
  • o4‑mini は 1/9 以下のコストで ほぼ o3 に匹敵する数学・コード性能 を実現。大量処理に最適。
  • o4‑mini‑high は mini のコストのまま深い推論を狙える “コスパ重視の高打点” オプション。ただし速度とメッセージ枠に注意。

用途・予算・応答速度の三要素で天秤を掛け、自分のユースケースに最適なモデルを選びましょう。 citeturn3search1turn1news15turn2view0turn7view0turn0search3turn1search6turn4search2turn4search3turn5view0turn6search0

3
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?