はじめに
2026年5月20日、Alibaba Cloud Summit にて Qwen3.7 Max が発表されました。エージェントタスク特化で設計された同モデルは、Anthropic API プロトコルをネイティブにサポートしており、環境変数を数行変えるだけで Claude Code のバックエンドとして動作します。
本記事では、Qwen3.7 Max の仕様・ベンチマーク・料金を整理し、DashScope API および Claude Code との連携手順を解説します。
この記事で学べること
- Qwen3.7 Max の基本仕様とエージェント性能
- Claude Opus 4.7・DeepSeek V4 Pro とのベンチマーク比較
- DashScope API を使った Python 実装
- Claude Code のバックエンドを Qwen3.7 Max に切り替える手順
対象読者
- Claude Code をコスト削減しつつ使い続けたい方
- エージェントワークロード向け LLM を比較・選定している方
- Alibaba Cloud の新しいモデルを API で試したい方
前提条件
- Python 3.10 以上
- Alibaba Cloud アカウント(DashScope API キー)
- Claude Code がインストール済みの環境(Claude Code との連携セクションのみ)
TL;DR
- Qwen3.7 Max は SWE-Pro 60.6・GPQA Diamond 92.4 で現在公開されているモデルの最高水準
- Anthropic API 互換のため Claude Code を 環境変数の変更だけで切り替え可能
- 料金は $2.50/$7.50 per 1M tokens(キャッシュ入力は $0.25)
- 35時間・1,158 ツール呼び出しの自律エージェントデモを達成済み
Qwen3.7 Max とは
Qwen3.7 Max は Alibaba の Qwen チームが開発した、エージェントタスク特化のフラッグシップ LLM です。
| 項目 | 値 |
|---|---|
| 発表日 | 2026年5月20日(Alibaba Cloud Summit) |
| コンテキストウィンドウ | 1,048,576 tokens(1M) |
| 思考モード | ネイティブ extended-thinking(自動割り当て) |
| 対応 API | DashScope、OpenAI 互換、Anthropic 互換 |
| オープンウェイト | なし(API 専用クローズドウェイト) |
| 知識カットオフ | 2026年1月 |
設計思想: Agent-First
Qwen3.7 Max の最大の特徴は「エージェントワークロードへの最適化」です。従来の汎用 LLM と異なり、以下の特性を設計中心に据えています。
- 長時間自律実行: 何百ものツール呼び出しを含む数十時間のタスクに対応
- ハードウェア適応能力: 訓練データに含まれない未知のアーキテクチャにも適応
- Anthropic API 互換: 既存の Claude エコシステム(Claude Code、OpenClaw など)をそのまま流用可能
ベンチマーク比較
2026年5月時点の主要ベンチマークを比較します。
| ベンチマーク | Qwen3.7 Max | DeepSeek V4 Pro Max | Kimi K2.6 Thinking |
|---|---|---|---|
| SWE-Pro | 60.6 | 59.0 | 59.5 |
| Terminal-Bench 2.0 | 69.7 | 67.9 | 66.7 |
| GPQA Diamond | 92.4 | 90.1 | 90.5 |
| HMMT 2026 Feb | 97.1 | — | — |
出典: Qwen3.7: The Agent Frontier — Alibaba Cloud Blog(2026年5月時点)
注目ポイント: SWE-Pro 首位
SWE-Pro はソフトウェアエンジニアリングタスクのリアルワールドベンチマークです。Qwen3.7 Max の 60.6 は比較表内で最高スコアを記録しており、コーディングエージェントとしての実力の高さが確認できます。
Terminal-Bench 2.0 は CLI エージェントのパフォーマンスを評価するベンチマークで、69.7 は Gemini 3.5 Flash の 76.2 には及ばないものの、DeepSeek V4 Pro Max(67.9)を上回っています。
料金比較
| モデル | 入力 | 出力 | キャッシュ入力 |
|---|---|---|---|
| Qwen3.7 Max | $2.50 | $7.50 | $0.25(90% OFF) |
| Claude Opus 4.7 | $5.00 | $25.00 | $0.50 |
| Gemini 3.5 Flash | $1.50 | $9.00 | $0.15 |
| DeepSeek V4 Pro Max | $0.44 | $0.87 | — |
Qwen3.7 Max の料金は Alibaba Cloud Model Studio 料金表 より(2026年5月時点)
DeepSeek V4 Pro Max は2026年5月22日に75%割引を恒久化。
Claude Opus 4.7 との比較: 入力で約 2 倍安($5.00 → $2.50)、出力で約 3.3 倍安($25.00 → $7.50)。エージェントワークロードでトークン消費が大きいケースでのコスト削減効果があります。
DashScope API を使った Python 実装
1. DashScope API キーの取得
Alibaba Cloud Model Studio にサインインし、API キーを発行します。インターナショナルアカウントの場合は dashscope-intl.aliyuncs.com エンドポイントを使用します。
2. 環境変数の設定
export DASHSCOPE_API_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxxxx"
3. OpenAI 互換エンドポイントでの基本呼び出し
from openai import OpenAI
client = OpenAI(
api_key="<your_dashscope_api_key>",
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
response = client.chat.completions.create(
model="qwen3.7-max",
messages=[
{"role": "user", "content": "Pythonでクイックソートを実装してください"}
],
)
print(response.choices[0].message.content)
4. Anthropic SDK 互換エンドポイントでの呼び出し
Qwen3.7 Max は Anthropic の Messages API 仕様に準拠したエンドポイントも提供しています。
import anthropic
client = anthropic.Anthropic(
api_key="<your_dashscope_api_key>",
base_url="https://dashscope-intl.aliyuncs.com/apps/anthropic",
)
message = client.messages.create(
model="qwen3.7-max",
max_tokens=4096,
messages=[
{"role": "user", "content": "Pythonでクイックソートを実装してください"}
],
)
print(message.content[0].text)
5. ツール呼び出し(Function Calling)
import anthropic
import json
client = anthropic.Anthropic(
api_key="<your_dashscope_api_key>",
base_url="https://dashscope-intl.aliyuncs.com/apps/anthropic",
)
tools = [
{
"name": "get_file_content",
"description": "指定したファイルの内容を読み込む",
"input_schema": {
"type": "object",
"properties": {
"path": {
"type": "string",
"description": "読み込むファイルのパス"
}
},
"required": ["path"]
}
}
]
response = client.messages.create(
model="qwen3.7-max",
max_tokens=4096,
tools=tools,
messages=[
{"role": "user", "content": "main.py の内容を確認してください"}
],
)
for block in response.content:
if block.type == "tool_use":
print(f"ツール呼び出し: {block.name}")
print(f"入力: {json.dumps(block.input, ensure_ascii=False, indent=2)}")
Claude Code のバックエンドを Qwen3.7 Max に切り替える
Qwen3.7 Max は Anthropic API プロトコルを完全サポートしているため、Claude Code の設定を変更するだけでバックエンドとして使用できます。
環境変数の設定
export ANTHROPIC_MODEL="qwen3.7-max"
export ANTHROPIC_BASE_URL="https://dashscope-intl.aliyuncs.com/apps/anthropic"
export ANTHROPIC_API_KEY="<your_dashscope_api_key>"
ANTHROPIC_BASE_URLには DashScope のインターナショナルエンドポイントを指定します。中国本土リージョンのアカウントの場合は Alibaba Cloud Model Studio の公式ドキュメント でエンドポイントを確認してください。
動作確認
# Claude Code を起動
claude
# バージョン確認(接続確認)
claude --version
# 簡単なタスクで動作確認
claude "このディレクトリのファイル一覧を確認して"
接続が成功すると、Claude Code の UI はそのままに Qwen3.7 Max が応答を生成します。レスポンスタイム・品質の変化を確認してください。
注意点
- Claude Code の一部の機能(Claude.ai との連携など)は Anthropic の公式エンドポイントに依存しているため動作しない可能性があります
-
ANTHROPIC_SMALL_FAST_MODELにも同じモデルを指定することで、補助タスクも Qwen で処理されます - DashScope アカウントのレートリミットに注意してください。エージェントの長時間実行ではトークン消費量が急増します
35時間自律エージェントの実績
Qwen チームは、Qwen3.7 Max を GPUカーネル最適化タスクに投入した実績を公開しています。
タスク概要
- 対象ハードウェア: T-Head ZW-M890 PPU(訓練データ未収録の Alibaba 独自チップ)
- タスク内容: SGLang 推論フレームワークの Extend Attention カーネル最適化(最大 32K エントリの prefix KV-cache との attention 計算)
- 目標: Triton 参照実装を上回るパフォーマンス
実行結果
| 指標 | 値 |
|---|---|
| 実行時間 | 35時間 |
| ツール呼び出し回数 | 1,158 回 |
| カーネル評価回数 | 432 回 |
| 達成パフォーマンス向上 | 10.0× ジオメトリック平均 |
他モデルとの比較
| モデル | 同タスクでの達成倍率 |
|---|---|
| Qwen3.7 Max | 10.0× |
| GLM 5.1 | 7.3× |
| Kimi K2.6 | 5.0× |
| DeepSeek V4 Pro | 3.3× |
エージェントは Split-K による prefix KV-cache の並列処理、host-device 同期のゼロコスト化(cudaMalloc → PyTorch テンソル)、クエリトークンのスレッドブロック内統合という3段階の最適化を自律的に発見・適用しています。
留意事項
Anthropic API 互換の制約
DashScope の Anthropic 互換エンドポイントは Anthropic Messages API の主要機能をカバーしていますが、Anthropic 独自の拡張機能(Extended Thinking の budget_tokens 制御など)は挙動が異なる場合があります。公式ドキュメントで対応状況を確認してください。
コンテキストウィンドウとコスト
1M トークンのコンテキストウィンドウは強力ですが、入力トークン数に応じて課金されます。長大なコンテキストを使い続けると想定外のコストが発生するため、キャッシュプレフィックスの活用($0.25 / 1M)が有効です。
オープンウェイトの非提供
現時点では API のみの提供で、モデルウェイトは公開されていません。ローカル実行やファインチューニングが必要な用途には対応できません。
まとめ
- SWE-Pro 首位 (60.6): コーディングエージェントとしての実力が数値で裏付けられている
- Claude Code と即時連携: Anthropic API 互換のため、環境変数の変更だけで既存ワークフローに組み込み可能
- Claude Opus 4.7 比で最大 3.3 倍の料金削減: エージェント長時間実行時のコスト最適化に有効(出力 $25.00 → $7.50)
- 35時間・10× ベンチマーク: 未知ハードウェアへの自律適応能力を示す実証データあり
Claude Code との連携手順のシンプルさは特筆に値します。Anthropic のモデルとほぼ同等の API 互換性があるため、既存のプロンプトやツール定義を変更せずに評価を始められます。


