DeepSeek V4 完全ガイド — 1.6T MoE、1Mコンテキスト、推論コスト73%削減
DeepSeek V4が2026年4月24日にリリースされました。1.6兆パラメータのMixture-of-Expertsアーキテクチャで、トークンあたり490億パラメータのみアクティブ。100万トークンのコンテキストウィンドウと、V3比73%低い推論コストを実現しています。
V4ファミリーの構成
| モデル | 総パラメータ | アクティブ | コンテキスト | 用途 |
|---|---|---|---|---|
| V4-Pro | 1.6T | 49B | 1Mトークン | 高度な推論、コーディング、エージェント |
| V4-Flash | 284B | 13B | 1Mトークン | 高速・低コスト処理 |
| V4 | — | — | 1Mトークン | 汎用チャット |
V3からの主な改善点
ハイブリッドアテンション — CSA(圧縮スパースアテンション)とHCA(高圧縮アテンション)を組み合わせ:
- 推論FLOPsを73%削減
- KVキャッシュメモリを90%削減
学習規模 — 32兆トークンでFP4量子化学習。Hugging Faceでオープンウェイト公開。
料金比較
| モデル | 入力(/1M) | 出力(/1M) | 備考 |
|---|---|---|---|
| DeepSeek V4-Pro(プロモ) | $0.435 | $0.87 | 75%割引、5月末まで |
| DeepSeek V4-Flash(プロモ) | $0.14 | $0.28 | 最安値 |
| GPT-5.5 | ~$5.00 | ~$75.00 | クローズド |
| GPT-5.4 | $2.50 | $15.00 | クローズド |
V4-Proは同等品質で5〜85倍安いコストを実現。
API接続(Crazyrouter経由)
from openai import OpenAI
client = OpenAI(
api_key="your-crazyrouter-key",
base_url="https://crazyrouter.com/v1"
)
response = client.chat.completions.create(
model="deepseek-v4-pro",
messages=[
{"role": "user", "content": "このコードベースを分析して最適化を提案してください"}
],
max_tokens=4096
)
print(response.choices[0].message.content)
V4-Flash(高速処理向け)
response = client.chat.completions.create(
model="deepseek-v4-flash",
messages=[
{"role": "user", "content": "この文書を3つのポイントで要約してください"}
]
)
使い分けガイド
| ユースケース | 推奨モデル | 理由 |
|---|---|---|
| 複雑な推論・数学 | V4-Pro(Maxモード) | 最高精度 |
| コーディング・分析 | V4-Pro(Highモード) | 速度と品質のバランス |
| 要約・分類 | V4-Flash | 最速・最安 |
| 長文処理(500K+) | V4-Pro/Flash | 1Mコンテキスト |
まとめ
DeepSeek V4はフロンティアレベルのAIをコストの数分の一で利用可能にします。Crazyrouterの統合APIで、V4、GPT-5.5、Claude、300以上のモデルを1行のコード変更で切り替えられます。