Gemini 2.5 Flash が出ました
Google Cloud Next 25 が開催されてから間もないですが、Gemini 2.5 Flash が Google AI Studio および Vertex AI 経由でプレビュー版として利用できるようになりました!
このモデルは 2.0 Flash の速度を基盤としながらも、推論機能が向上し、コスト効率にも重点を置いているとのことです。
主な特徴は以下です。
• ハイブリッド推論:Gemini 2.5 Flashは、ハイブリッド推論モデルであり、開発者は思考 (thinking) のオン/オフを切り替えることができます。
・複雑な推論に優れる:複雑で複数ステップのタスクでは、思考 (thinking) によって回答の精度が向上します。
・調整可能な思考予算 (thinking budget) :思考予算 (thinking budget) を設定することで、品質、コスト、レイテンシの適切なトレードオフを見つけることができます。必要な場合にのみ推論機能の料金を支払うことができます。
詳細はこちらからどうぞ。
試してみる
それでは実際に触ってみたいと思います。今回は Google AI Studio から確認します。Chat を開き、モデルの選択をすると、Gemini 2.5 Flash(04-17バージョン) が出てきました!
Thinking と Non-thinking で Output の価格が異なるみたいです。
Thinkingと Non-thinking の設定、Thinking budget の設定は画面右側のトグルスイッチで切り替えることができました。
それではお試しで動かしてみます。Thinking mode をオン、Thinking budgetをオンとして、プロンプトに ”nの2乗が偶数であるとき、nも偶数であることを証明してください。"とプロンプトに入力し、実行しました。
するとGemini 2.5 Flash からは以下のような回答が返ってきました。(長かったため途中省略していますが)背理法と対偶による証明を回答してくれました。思考時間は5.0秒、回答までの時間は10.6秒でした。
ちなみに同じ質問をGemini 2.5 Pro Previewで実行してみたところ、思考時間は11.0秒、回答までの時間は14.6秒となり、Gemini 2.5 Flash の方が回答までの時間が早かったです。
まとめ
Gemini 2.5 Flash は、レスポンスが速く品質の良いものを低価格でお届けする、というバランスの取れたモデルとなってるのかなと感じました。
現在プレビュー版とのことですので、興味のある方はお試しください。