はじめに
2026年4月8日、Metaは新会社「Meta Superintelligence Labs(MSL)」初の旗艦モデル Muse Spark を発表しました。従来のMetaのAI開発(Llamaシリーズ)とは一線を画した、9ヶ月間にわたるスタックの全面再設計(ground-up rebuild)から生まれたモデルです。
Muse Sparkは「Contemplating Mode(熟考モード)」という独自のマルチエージェント並列推論アーキテクチャを採用し、単一のモデルが長く考えるのではなく、複数のエージェントが並列に推論し合意形成するというアプローチで、従来モデルを超える精度を実現しています。
この記事では、Muse Sparkの技術的なアーキテクチャ・ベンチマーク・3つの推論モード・開発者向けアクセス方法を解説します。
この記事で学べること
- Muse Sparkが他のLLMと根本的に異なる理由
- Contemplating Mode(並列エージェント推論)の仕組み
- Thought Compression(思考圧縮)がなぜ重要なのか
- 主要ベンチマークでのGPT-5.4・Gemini 3.1との比較
- 現時点でのアクセス方法とAPIへの移行見通し
対象読者
- 最新LLMのアーキテクチャに関心があるエンジニア
- エージェント型AI設計のトレンドを追っている方
- Metaの新AIスタックがどう変わったのか知りたい方
TL;DR
- Muse SparkはMetaが9ヶ月間のスタック全面再設計で作り上げた初の「Superintelligence Labs」モデル
- 3つの推論モード: Instant(即時)、Thinking(思考)、Contemplating(並列エージェント熟考)
- Contemplating Modeは複数エージェントが並列推論し「思考圧縮(Thought Compression)」で高効率化
- HealthBench Hard 42.8(GPT-5.4: 40.1 を上回る)、HLE(Humanity's Last Exam)50.2%
- 現在はmeta.aiで試用可能。APIはパートナー向けプレビュー段階
Muse Sparkとは?
Meta Superintelligence Labs(MSL)
Muse Sparkは、Metaが2025年に設立した内部組織「Meta Superintelligence Labs」から生まれた最初のモデルです。MetaのChief AI Officer(元Scale AI CEO)のAlexandr Wangが主導し、既存のLlamaシリーズとは独立したチームとインフラ体制で開発されました。
"This represents a ground-up overhaul of Meta's AI stack."
— TechCrunch(2026-04-08)
マルチモーダル+推論+エージェント
Muse Sparkの設計思想は「最初からすべてを統合する」ことです:
| 機能 | 詳細 |
|---|---|
| マルチモーダル | テキスト・画像を同一モデルでネイティブ処理 |
| 推論 | Visual Chain of Thought(視覚的推論の連鎖) |
| Tool Use | 外部ツール呼び出しをネイティブサポート |
| マルチエージェント | Contemplating Modeで複数エージェントを並列制御 |
3つの推論モード
Muse Sparkは用途に応じて3種類の推論モードを使い分けることができます。
1. Instant(即時モード)
最も高速な応答モードです。日常的な質問・要約・変換タスクに適しています。レスポンス時間は通常のLLMとほぼ同等で、思考プロセスは最小化されます。
適したタスク: チャット応答・短文生成・定型的な情報検索
2. Thinking(思考モード)
内部的に推論プロセスを実行してから回答を生成します(公式ブログでの技術詳細は限定的)。Instantよりも精度が高く、複雑な質問に対応できます。Contemplatingほどの計算コストはかかりません。
適したタスク: 数学・コーディング・複雑な質問応答
3. Contemplating(熟考モード)
Muse Sparkの最大の特徴です。複数のエージェントが同時並列に推論し、その結果を集約して最終回答を生成します。
動作フロー:
- 問題を受け取ると、複数の推論エージェント(サブエージェント)が同時に起動
- 各エージェントは独立したChain of Thoughtを実行
- エンセンブル集約によって複数の推論結果を統合
- 最終回答を出力
従来の「1つのモデルがより長く考える」アプローチでは、レスポンスタイムが直線的に増加していました。Contemplating Modeは並列性を活かして精度を維持しつつレイテンシの増加を抑制します。
Thought Compression(思考圧縮)
Muse Sparkのもう一つの核心的な技術です。
問題意識
大規模推論モデルの課題として、正確さを追求するほどトークン使用量が増加し、コストと遅延が増大する問題がありました。
RL訓練による解決
Muse SparkはRL(強化学習)訓練の報酬関数に「思考時間へのペナルティ」を組み込んでいます。
報酬 = 正解率 − α × 思考トークン数
この設計により、モデルは必要最小限の推論ステップで正解を得ることを学習します。
"After an initial period where the model improves by thinking longer, the length penalty causes thought compression — Muse Spark compresses its reasoning to solve problems using significantly fewer tokens."
— MarkTechPost(2026-04-09)
結果
同水準の精度をLlama 4 Maverick比で10倍以上少ない計算量で達成するとMeta公式が発表しています(公式ブログ参照)。
ベンチマーク比較
公式発表および第三者評価(Artificial Analysis)に基づく主要ベンチマーク結果です。
HealthBench Hard(医療推論)
| モデル | スコア |
|---|---|
| Muse Spark (Contemplating) | 42.8 |
| GPT-5.4 | 40.1 |
| Gemini 3.1 Pro | 20.6 |
HealthBench Hardは医療診断・治療計画立案に関する複雑な推論を評価するベンチマークです(公式ブログ)。
HLE(Humanity's Last Exam、科学推論)
| モデル | スコア |
|---|---|
| Muse Spark (Contemplating) | 50.2% |
| GPT-5.4 Pro | 43.9% |
HLEは数学・科学・人文科学にわたる最難関の質問群で構成されるベンチマークです。
CharXiv(グラフ・図表理解)
| モデル | スコア |
|---|---|
| Muse Spark | 86.4 |
| GPT-5.4 | — |
ベンチマーク結果はMeta公式ブログの発表時点のものです。独立した第三者による継続的な評価についてはArtificial Analysisを参照してください。
現時点でのアクセス方法
Muse Sparkは2026年4月8日現在、以下の形で利用できます。
1. meta.ai(コンシューマー向け)
FacebookまたはInstagramアカウントでログインし、meta.ai から試用可能です。Instant・Thinking・Contemplatingの3モードを選択して利用できます。
2. Meta AIアプリ・WhatsApp・Instagram
Meta AIアプリでは既にMuse Sparkが動作しています。WhatsApp・Instagram・Facebook・Messengerへも順次ロールアウト予定です(Meta公式発表)。
3. API(パートナー限定プレビュー)
現時点ではパートナー企業向けのプライベートプレビューが提供されています。一般開発者向けの公開APIは未発表ですが、Metaは「将来的により広いAPIアクセスを提供する」と明言しています(公式発表)。
公開APIの料金・エンドポイント・ドキュメントはまだ発表されていません。正式公開後はMeta for Developersから情報が提供される見通しです。
LlamaシリーズとMuse Sparkの違い
Muse SparkとLlamaシリーズは同じMetaのモデルですが、開発アプローチが根本的に異なります。
| 比較軸 | Llama 4(最新) | Muse Spark |
|---|---|---|
| 開発体制 | FAIR(Meta AI Research) | Meta Superintelligence Labs |
| 公開方針 | オープンウェイト | クローズド(API提供予定) |
| アーキテクチャ | Transformer / MoE | 独自スタック(詳細非公開) |
| 推論設計 | 標準的な推論 | Contemplating Mode(並列エージェント) |
| 特化領域 | 汎用・オープン活用 | 精度重視・エンタープライズ |
Llamaシリーズは引き続きオープンウェイトで提供されますが、Muse Sparkは精度とスケールを優先した商用モデルとして別ラインで展開されます。
まとめ
- Muse SparkはMeta Superintelligence Labsの最初のモデル。LlamaシリーズとはまったくのNEW LINEで、9ヶ月の完全再構築から生まれた
- **Contemplating Mode(熟考モード)**はマルチエージェント並列推論という新アーキテクチャ。単一モデルの長時間思考ではなく並列性でレイテンシを抑制しつつ精度を確保する
- Thought CompressionはRLペナルティで思考トークン数を最小化し、Llama 4 Maverick比で10倍以上少ない計算量で同水準の性能を実現(公式ブログ)
- ベンチマーク(Contemplating Mode): HealthBench Hard 42.8(GPT-5.4: 40.1)、HLE 50.2%(GPT-5.4 Pro: 43.9%)、CharXiv 86.4
- 現在はmeta.aiで試用可能。開発者向けAPIはパートナープレビュー段階で、正式公開のタイムラインは未発表
Metaはオープンウェイト(Llama)と商用精度重視(Muse Spark)という2路線でAI開発を加速する方針を明確にしました。Muse SparkのAPIが公開された際には、医療・科学推論・複雑なマルチモーダルタスクへの応用が大きく広がると期待されます。
参考リンク
- Introducing Muse Spark: Scaling Towards Personal Superintelligence — Meta AI公式ブログ(2026-04-08)
- Meta debuts the Muse Spark model in a 'ground-up overhaul' of its AI — TechCrunch
- Meta Muse Spark: Benchmarks, Modes & Developer Guide — Lushbinary
- Meta Superintelligence Lab releases Muse Spark — MarkTechPost(技術詳細)
- Muse Spark: Features, Benchmarks, and How to Use It — DataCamp