はじめに
2026年3月11日、OpenRouterに「Hunter Alpha」と名乗る正体不明のモデルが突如現れた。1Mトークンのコンテキストウィンドウ、無料アクセス、そしてフロンティアモデルに迫る性能。開発者コミュニティでは「DeepSeek V4のリークでは」「新たなOpenAIの実験モデルでは」と憶測が飛び交い、わずか1週間で 1兆トークン 以上が処理された。
3月18日、正体が明かされた。Hunter Alphaの開発元は Xiaomi(シャオミ) のAI部門 MiMo だった。スマートフォンメーカーとして知られるXiaomiが、1兆パラメータ超のLLMを秘密裏に開発し、匿名テストでフロンティアモデルに匹敵する性能を証明したのである。
この記事では、MiMo-V2-Proのアーキテクチャ、ベンチマーク性能、APIを使った実装方法、そしてMiMo-V2ファミリー全体の構成をまとめる。
この記事で学べること
- Hunter Alpha事件の経緯と技術的背景
- MiMo-V2-Proの1T MoEアーキテクチャとHybrid Attention機構
- フロンティアモデルとの性能・コスト比較
- OpenRouter経由でMiMo-V2-ProをPythonから利用する方法
- MiMo-V2ファミリー(Pro / Omni / TTS)の全体像
対象読者
- LLMの性能とコスト効率に関心があるエンジニア
- AIエージェント構築でモデル選定を検討している方
- 中国発LLMの最新動向を把握したい方
TL;DR
- Xiaomi MiMo-V2-Proは 1T超パラメータ(42Bアクティブ) のMoEモデルで、コーディング性能がClaude Sonnet 4.6を上回り、エージェント性能がOpus 4.6に迫る
- 「Hunter Alpha」として匿名テストされ、1週間で1兆トークン処理。コミュニティがDeepSeek V4と誤認する性能を発揮
- $1 / $3 per 1Mトークン (入力/出力)でフロンティアモデルの約1/25のコスト。OpenAI互換APIですぐに利用可能
Hunter Alpha事件 — 匿名テストから正体判明まで
OpenRouterに現れた謎のモデル
2026年3月11日、AIモデルのマーケットプレイスであるOpenRouterに「Hunter Alpha」という名前のモデルが登場した。モデルの開発元は非公開、しかし以下の特徴が開発者の注目を集めた。
- 1Mトークン のコンテキストウィンドウ
- 無料で利用可能
- コーディングタスクで既存のフロンティアモデルに匹敵する応答品質
Hunter Alphaは登場直後からOpenRouterのデイリーチャートでトップに立ち、利用量は急増した。開発者がもっとも多く呼び出したのはコーディング関連のタスクで、実際の開発ワークフローで高い信頼性を示した。
コミュニティの推理と誤認
正体が不明であったため、コミュニティでは活発な議論が展開された。「応答の質やスタイルからDeepSeek V4の初期テスト版ではないか」という説が有力視されたが、Xiaomiの名前はほぼ誰も挙げなかった。スマートフォンメーカーがフロンティアLLMを開発するという発想自体が、当時の常識から外れていたためである。
正体判明 — Xiaomi MiMoチーム
3月18日、XiaomiのAI部門 MiMo がHunter Alphaの正体を公表した。Hunter AlphaはMiMo-V2-Proの初期テストビルドであり、匿名テスト期間中に 1兆トークン以上 が処理されたことが明らかになった。
MiMoチームを率いるのは Luo Fuli(罗福莉)氏 で、DeepSeekのR1やVシリーズの開発に携わった中心的な研究者である。2025年末にXiaomiへ移籍し、MiMo-V2シリーズの開発を主導している。
MiMo-V2-Pro アーキテクチャ
Mixture-of-Experts(MoE)構成
MiMo-V2-Proは以下の構成を持つMoEアーキテクチャを採用している。
| パラメータ | 値 |
|---|---|
| 総パラメータ数 | 1T超(1兆以上) |
| アクティブパラメータ数 | 42B(推論時に実際に使用される量) |
| コンテキストウィンドウ | 1,000,000トークン |
| アーキテクチャ | Mixture-of-Experts |
| 先代モデルとの比較 | MiMo-V2-Flashの約3倍の総パラメータ規模 |
MoEアーキテクチャにより、1兆を超える総パラメータの知識を保持しつつ、推論時には42Bのアクティブパラメータのみを使用する。これによって、推論コストを抑えながらフロンティアモデルに迫る性能を実現している。
Hybrid Attention機構
MiMo-V2-Proの中核技術の一つが Hybrid Attention 機構である。先代モデルから継承されたこの仕組みでは、Sliding Window Attention(SWA)とGlobal Attention(GA)を組み合わせ、そのハイブリッド比率を5:1から 7:1 へ引き上げた。
この比率が意味するのは、入力データの約85%にはSWAによる軽量な処理を適用し、残り約15%の最も重要な部分にのみGAによる高密度のアテンション処理を行うということである。128トークンのウィンドウサイズと組み合わせることで、KVキャッシュのメモリ使用量を約6分の1に削減しながら、長文コンテキストでの性能を維持している。
ベンチマーク性能
主要ベンチマークスコア
Xiaomi公式ページで公開されているMiMo-V2-Proのベンチマーク結果は以下の通りである。
| ベンチマーク | スコア | グローバル順位 |
|---|---|---|
| PinchBench | 81.0 | #3 |
| ClawEval | 61.5 | #3 |
| SWE-bench Verified | 78.0 | オープンソースモデル中トップクラス |
| SWE-bench Multilingual | 71.7 | — |
| Terminal-Bench 2.0 | 57.1 | — |
| AIME 2025 | 94.1% | — |
VentureBeatをはじめとする複数のメディアの報道によると、コーディング性能はClaude Sonnet 4.6を上回り、エージェントタスク(ClawEval)はClaude Opus 4.6に迫る水準とされている。Artificial Analysisの総合知能指数では 世界8位 、中国発モデルでは 2位 にランクインしている。
コスト効率
MiMo-V2-Proの最大の強みの一つがコスト効率である。
| モデル | 入力コスト(/1Mトークン) | 出力コスト(/1Mトークン) | AA Index実行コスト |
|---|---|---|---|
| MiMo-V2-Pro | $1.00 | $3.00 | $348 |
| Claude Opus 4.6 | $15.00 | $75.00 | $2,486 |
| GPT-5.2 | $15.00 | $60.00 | $2,304 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | $720 |
Artificial Analysisのインデックスを実行した場合のコストは $348 で、Claude Opus 4.6($2,486)の約 1/7 、GPT-5.2($2,304)の約 1/7 である。エージェント性能がOpus 4.6に迫りながら、コストが1桁以上安いという点は、特に大量のAPIコールを行うエージェントシステムで大きなメリットとなる。
なお、256Kトークンを超えるコンテキストを使用する場合は、入力$2.00/出力$6.00と2倍の料金が適用される。
MiMo-V2ファミリー全体像
Xiaomiは2026年3月18-19日に、MiMo-V2ファミリーとして3つのモデルを同時発表した。それぞれ「脳」「感覚」「声」を担当する設計になっている。
MiMo-V2-Pro(脳)
エージェントシステムの中核として機能する言語モデル。複雑なワークフローのオーケストレーション、マルチステップ推論、ツール呼び出しに最適化されている。本記事で詳述した通り、1T超のMoEアーキテクチャとHybrid Attention機構を備える。
MiMo-V2-Omni(感覚)
テキスト・画像・動画・音声を 単一の統合アーキテクチャ で処理するマルチモーダルモデル。各モダリティを個別のエンコーダで処理してから統合する従来のアプローチとは異なり、全モダリティを同じ表現空間で扱うことで、深いクロスモーダル推論を実現している。
MiMo-V2-TTS(声)
独自のAudio Tokenizerとマルチコードブック音声・テキスト統合アーキテクチャを採用した音声合成モデル。 1億時間以上 の音声データで事前学習され、多次元強化学習による調整を経ている。自然な感情表現と多言語対応を特徴とする。
3モデルの投資規模
Caixin Globalの報道によると、XiaomiはMiMo-V2シリーズの開発に 87億ドル(約8.7 billion USD) を投じている。スマートフォン事業で培った大規模製造・最適化のノウハウをAI開発に転用している形である。
OpenRouter経由でのAPI活用
MiMo-V2-ProはOpenAI互換APIを提供しており、既存のPythonコードからほぼ変更なしで利用できる。以下にOpenRouter経由での基本的な利用方法をまとめる。
セットアップ
pip install openai
基本的なチャット補完
from openai import OpenAI
client = OpenAI(
api_key="your-openrouter-api-key",
base_url="https://openrouter.ai/api/v1",
)
response = client.chat.completions.create(
model="xiaomi/mimo-v2-pro",
messages=[
{
"role": "system",
"content": "You are a senior software engineer."
},
{
"role": "user",
"content": "Pythonでファイルの差分を表示するCLIツールを設計してください。"
},
],
max_tokens=4096,
)
print(response.choices[0].message.content)
ツール呼び出し(Function Calling)
MiMo-V2-Proはエージェントシナリオ向けに最適化されており、OpenAI互換のFunction Calling形式をサポートしている。
import json
from openai import OpenAI
client = OpenAI(
api_key="your-openrouter-api-key",
base_url="https://openrouter.ai/api/v1",
)
tools = [
{
"type": "function",
"function": {
"name": "search_codebase",
"description": "Search for code patterns in the repository",
"parameters": {
"type": "object",
"properties": {
"query": {
"type": "string",
"description": "Search query or regex pattern",
},
"file_type": {
"type": "string",
"description": "File extension filter (e.g., .py, .ts)",
},
},
"required": ["query"],
},
},
}
]
response = client.chat.completions.create(
model="xiaomi/mimo-v2-pro",
messages=[
{
"role": "user",
"content": "認証に関するミドルウェアのコードを探してください",
}
],
tools=tools,
tool_choice="auto",
)
message = response.choices[0].message
if message.tool_calls:
for tool_call in message.tool_calls:
print(f"Function: {tool_call.function.name}")
print(f"Arguments: {tool_call.function.arguments}")
エコシステム互換性
MiMo-V2-ProはOpenAI互換APIを採用しているため、以下のツール・フレームワークでそのまま利用できる。
| ツール / フレームワーク | 対応状況 |
|---|---|
| OpenClaw | 対応済み(PR #49214でマージ) |
| LangChain / LiteLLM | OpenAI互換として利用可能 |
| Cline / Roo Code | プロバイダー設定でOpenRouterを指定 |
| Claude Code | OpenRouter経由で利用可能 |
| Puter.js | 公式対応済み |
開発者にとっての位置づけ
MiMo-V2-Proは、以下のようなユースケースで特に有効と考えられる。
コスト重視のエージェントシステム: ClawEval 61.5のエージェント性能を$1/$3のコストで利用できるため、大量のAPI呼び出しが発生するマルチエージェントシステムに適している。
コーディングアシスタント: PinchBench 81.0(グローバル#3)のコーディング性能を持ち、コード生成・レビュー・リファクタリングタスクの費用対効果が高い。
長文コンテキスト処理: 1Mトークンのコンテキストウィンドウにより、大規模なコードベース全体やドキュメント群をコンテキストに含めた処理が可能である。256K以下であれば低コストで運用できる。
一方で、最高精度が求められるタスクではClaude Opus 4.6やGPT-5.4 Proに及ばない点、中国のデータ規制下にあるモデルであるため企業のコンプライアンスポリシーとの整合性を確認する必要がある点は留意事項となる。
まとめ
- Xiaomi MiMo-V2-Proは、1T超パラメータのMoEアーキテクチャと7:1 Hybrid Attention機構により、フロンティアモデルに迫る性能をコスト1/7以下で提供する
- Hunter Alphaとしての匿名テストで1兆トークンを処理し、正体判明前にコーディング・エージェントタスクでの実力を証明した
- OpenAI互換APIにより、既存のPythonコードやエージェントフレームワークからほぼ変更なしで利用できる
- MiMo-V2ファミリー(Pro / Omni / TTS)として言語・マルチモーダル・音声の3モデルを同時展開しており、Xiaomiが総合的なAIプラットフォームを構築していることがわかる
LLMの性能がコモディティ化に向かう中で、MiMo-V2-Proは「スマートフォンメーカーでもフロンティアLLMを開発できる」という事実を示した。コスト効率の高いエージェントシステムを構築する際のモデル候補として、検討に値する選択肢である。



