コスト的にオススメのLLM APIを探す
2025年8月25日現在、主要4社についてのLLM・生成AIを含むAPIの利用料をまとめてみました。
今回の記事では、実際の運用を想定してオススメは
- 「コストパフォーマンス」を基準に考えました。
具体的には、テキスト生成(チャット/会話)のような一般的なタスクを想定し、安価で実用的なモデルを優先します。
ユースケースが特殊(例: 画像生成、音声、埋め込み)であれば変わる可能性があります。
コストが安いLLM API
価格比較をテーブルで抜粋(テキスト生成モデル中心、入力/出力のUSD/1Mトークン。安価順に並べ替え):
| 会社 | モデル名 | 入力価格 (USD/1M) | 出力価格 (USD/1M) | 備考 |
|---|---|---|---|---|
| OpenAI | GPT-5 nano | 0.05 | 0.40 | 小型モデル、安価だが性能はmini/nano級 |
| Gemini 2.5 Flash-Lite | 0.10 (テキスト) | 0.40 | 多モーダル対応、無料枠あり | |
| Gemini 2.0 Flash | 0.10 (テキスト) | 0.40 | 旧世代だが安価 | |
| OpenAI | GPT-5 mini | 0.25 | 2.00 | バランス型 |
| Anthropic | Claude Haiku 3 | 0.25 | 1.25 | 安価なHaikuシリーズ |
| DeepSeek | deepseek-chat | 0.07 (hit)/0.27 (miss) | 1.10 | キャッシュでさらに安く、夜間50%オフ |
| Gemini 2.5 Flash | 0.30 (テキスト) | 2.50 | 多モーダル、音声/画像対応 | |
| OpenAI | GPT-4.1 mini (FT版) | 0.80 | 3.20 | ファインチューニング版 |
| Anthropic | Claude Haiku 3.5 | 0.80 | 4.00 | Haikuのアップデート版 |
| DeepSeek | deepseek-reasoner | 0.14 (hit)/0.55 (miss) | 2.19 | 推論特化、夜間割引あり |
| OpenAI | GPT-5 | 1.25 | 10.00 | 大型、高性能だが高価 |
| Gemini 2.5 Pro | 1.25 (≤200K) | 10.00 | 長文で料金アップ | |
| Anthropic | Claude Sonnet 3.7/4 | 3.00 | 15.00 | 中型、200K超で料金2倍 |
| Anthropic | Claude Opus 4/4.1 | 15.00 | 75.00 | 最上位、非常に高価 |
(注: 価格は資料の概算値。埋め込み/画像/音声は別途で、例: OpenAIのtext-embedding-3-smallは入力0.02 USDと激安。)
オススメのAPI
オススメはユースケース次第ですが、資料の価格重視で一般的なテキスト生成(例: チャットボット、文章作成)を想定すると、以下の順位です。理由は「低コストで実用性が高い」点(出力価格が特に重要、生成量が多いため)。
-
トップオススメ: OpenAIのGPT-5 nano (またはmini)
- 理由: 入力0.05/出力0.40 USDと資料内で最安級。nanoは小型だが、OpenAIの信頼性が高く、Batchでさらに50%オフ可能。初心者向けにモデル選択肢が多く、埋め込み(0.02 USD)も安い。無料枠なしだが、全体的にバランス良し。
- 向いている人: 予算を抑えたい個人開発者や小規模アプリ。性能がnano級なので、複雑タスクはmini(0.25/2.00 USD)にアップグレード。
- デメリット: 大型モデル(GPT-5: 1.25/10.00 USD)ほどの高精度でない可能性
-
次点: DeepSeekのdeepseek-chat
- 理由: 入力0.07 (hit時)/出力1.10 USDと安く、夜間帯で半額(例: 出力0.55 USD)。キャッシュ機能で繰り返し利用時さらにコストダウン。プリペイド方式でシンプル。
- 向いている人: 時間帯を選べるユーザー(夜間利用で激安)。会話特化で、reasoner(0.14/2.19 USD)は論理推論に強い。
- デメリット: モデル数が少なく、多モーダル(画像/音声)未対応。性能の詳細が資料にない。
-
多機能派オススメ: GoogleのGemini 2.5 Flash-Lite
- 理由: 入力0.10/出力0.40 USDと安価で、無料枠(20万トークン)あり。テキスト以外に画像/音声/動画対応。Batch50%オフでスケールしやすい。
- 向いている人: マルチメディアアプリ開発者。動画生成(Veo 3 Fast: 0.40/秒)も安い。
- デメリット: 長文で料金アップ(Pro版)。Vertex AIの設定がやや複雑。
-
高性能派: AnthropicのClaude Haiku 3
- 理由: 入力0.25/出力1.25 USDと手頃で、Claudeシリーズの精度が高い(資料未記載だが一般知識)。Batch50%オフ、長文キャッシュでコスト抑えられる。
- 向いている人: 精度重視のビジネスユース。Sonnet/Opusは高価(3.00/15.00 USD以上)なので避ける。
- デメリット: 全体的に高めで、多モーダル弱い。
注意点
- コスト計算のヒント: 実際の料金はトークン数(≈単語数×1.3)で決まる。例: 1000トークン生成でGPT-5 nanoは出力0.0004 USD(約0.06円)と微々たるもの。
- 更新確認: 資料は2025年8月時点。最新価格は出典URL(OpenAI: https://openai.com/api/pricing/ など)で確認を。
予算重視ならOpenAIのnanoからスタートするのが無難です!
個人的な感想
GoogleのGemini 2.5 Flush Liteを今使っていますが、Lite版でもGoogle検索が実装されており自然言語で最新情報を持ってくるフロー(「○○の情報を検索してリストで返して」)が実現できます。これは、既存のプログラムでは考えられなかった実装方法です。LLMが検索や思考が使えるので、随分と柔軟な使い方が出来ます。Google Gemini 2.5 Flush Liteは簡単なタスクではかなり高性能でコスパは相当高いと思います。
各社50%のバッチ割引というのもあるみたいです。これは即時回答せずに最大24時間以内にタスクを完了するというモードでいつ実行されるか保証されないが、安くなるというもののようです。たとえば資料を読んでその概要やキーワードを導くタスクなどでは、このバッチモードで実装すれば半額になるということです。LLMを使ったら人間がやらないといけないようなプログラムに書きにくいタスクも実行できるのでアイディア次第で本当に役に立ちます。
ちなみにこのコスト調査結果から、オススメを分析してくれたのはGrok4です。