ChatGPT と Gemini の 最速設定 についてまとめます。
結論として、どちらも 2 秒以内に読み始め可能 な設定が存在し、体感的にもストレスなく利用できます。
小規模な検証ですが、実用上は十分な速度です。
前提として、stream の実装は必須 になります。
初期トークンが即時に返らない設定では、どうしても待ち時間が発生します。
ChatGPT の場合は、
モデルを gpt-5-nano に設定し、
reasoning_effort: "minimal" を指定することで、2 秒以内に表示が開始 されることを確認しました。
Gemini の場合は、
モデルを gemini-2.5-lite に設定することで、
同様に 2 秒以内での表示開始 が可能です。
これらの生成 AI は、適切なモデル選択と streaming を行えば、
待たされている感覚がほぼなく、日常利用でも十分に快適 です。
すでに API Key を発行している方(※ Gemini は無料枠あり)向けに、
反応速度を実際に確認できる Chrome 拡張 を用意しています。
以下の記事内にリンクがありますので、
どの程度の速度でレスポンスが返ってくるか是非ご確認ください。
申し訳ありませんが、ChatGPT は service_tier: "flex"(処理の優先度を下げて、料金を安くする設定) を設定しているため、時間により遅いです。本来の速度が知りたい方は service_tier: "flex", の記述を削除して下さい。
是非 ChatGPT で不審なコード(情報の抜き取りなど)が含まれていないか調査した上でご利用下さい。