はじめに
2026年3月24日、Arm Holdingsは同社35年の歴史で初となる自社設計シリコン製品 Arm AGI CPU を発表した。「AGI」は「Agentic General Infrastructure」の略で、AIエージェントの大規模並列処理を支えるデータセンターCPUとして設計されている。
従来Armはチップの「設計図(IP)」をライセンス提供するビジネスモデルで成長してきたが、今回は TSMC 3nmプロセスで製造した完成品シリコンを自社ブランドで販売する という歴史的な転換点となる。Metaを開発パートナーとし、OpenAI・Cerebras・Cloudflareなど主要AI企業が採用を表明している。
この記事では、Arm AGI CPUのアーキテクチャ・スペック・エコシステムを整理し、AIデータセンターにもたらす変化を解説する。
この記事で学べること
- Arm AGI CPUの技術仕様とアーキテクチャの全体像
- x86サーバーCPUとの性能密度比較
- エージェントAIインフラにおける具体的なユースケース
- パートナーエコシステムと導入ロードマップ
対象読者
- AIインフラ・クラウドアーキテクチャに関わるエンジニア
- サーバーハードウェアの選定に携わる方
- Armベースデータセンターの動向に関心がある方
TL;DR
- Arm初の自社シリコン。最大 136コアNeoverse V3 、TSMC 3nm、300W TDP
- x86比 2倍以上のラック性能密度 (36kWラックに8,160コア)
- Meta共同開発、OpenAI・Cerebras・Cloudflare等が採用。2026年後半に量産開始
Arm AGI CPUのアーキテクチャ
コアとプロセッサ構成
Arm AGI CPUは、 Armv9.2命令セット に基づく最大136基のNeoverse V3コアを搭載する。主要な仕様は以下の通りである。
| 項目 | 仕様 |
|---|---|
| コア数 | 最大136コア(Neoverse V3) |
| プロセスノード | TSMC 3nm(N3P) |
| 動作周波数 | 3.2 GHz(オールコア)/ 3.7 GHz(ブースト) |
| TDP | 300W(空冷対応) |
| L2キャッシュ | 2 MB/コア(専用) |
| システムキャッシュ | 128 MB |
| 命令セット | Armv9.2(bfloat16、INT8 AI命令対応) |
| SIMD | 2x 128-bit SVE2ユニット/コア |
ダイは2チップレット構成で、コア間接続にはAMBA CHI Extension Linksが採用されている。各コアにbfloat16とINT8のAI推論命令が統合されているため、アクセラレータと連携するホストCPUとしてのAI処理効率が高い設計となっている。
メモリサブシステム
メモリ帯域はAIワークロードのボトルネックになりやすい要素だが、Arm AGI CPUは業界最高水準の構成を備えている。
| 項目 | 仕様 |
|---|---|
| メモリタイプ | DDR5 RDIMM |
| チャネル数 | 12チャネル |
| 最大速度 | DDR5-8800 MT/s |
| 集約帯域 | 800 GB/s超 |
| コアあたり帯域 | 6 GB/s |
| レイテンシ | サブ100ナノ秒 |
12チャネルDDR5は、AMD EPYCの12チャネルと同等であり、Intel Xeonの8チャネルを大きく上回る。コアあたり6 GB/sの帯域は、LLM推論時のKVキャッシュ処理やエージェントのコンテキスト管理で威力を発揮する。
I/O接続
| 項目 | 仕様 |
|---|---|
| PCIe | 96レーン PCIe Gen6 |
| CXL | CXL 3.0 Type 3対応 |
| ソケット | 2ソケット構成対応 |
| 制御レーン | 6x PCIe Gen4(各1レーン) |
96レーンのPCIe Gen6は、最大8基のアクセラレータ(GPU/TPU/カスタムASIC)を接続可能な帯域を提供する。CXL 3.0 Type 3はメモリプーリングに対応し、複数ノード間でメモリリソースを柔軟に共有できる。
x86との性能密度比較
Arm AGI CPUの最大の訴求点は、ラック単位での 性能密度 である。
ラック構成の比較
| 項目 | Arm AGI CPU | x86サーバー(参考) |
|---|---|---|
| フォームファクタ | 1U OCP DC-MHS デュアルノード | 2U(一般的なデュアルソケット) |
| 1Uあたりコア数 | 272コア(136 x 2ノード) | 128〜192コア(参考値) |
| TDP/ノード | 300W | 400〜500W |
| 36kWラック搭載数 | 30台(1U) | 15〜18台(2U) |
| ラックあたりコア数 | 8,160コア | 1,920〜3,456コア(参考値) |
Armの公式発表 では「x86ベースの同等構成と比較して ラックあたり2倍以上の性能 」と主張している。300Wという空冷対応のTDPにより、1Uシャーシへの搭載が可能となり、同じ36kWの電力バジェット内で圧倒的なコア密度を実現している。
エネルギー効率の意味
データセンターの電力コストはAIワークロードの拡大に伴い急増している。Arm AGI CPUの300W空冷設計は、液冷インフラが不要という運用上の大きなメリットがある。既存のデータセンター設備をそのまま活用しながら、AI処理能力を大幅にスケールできる。
エージェントAIインフラにおけるユースケース
Arm AGI CPUの「AGI = Agentic General Infrastructure」という命名が示す通り、このプロセッサはAIエージェントの大規模運用を主要ターゲットとしている。
1. アクセラレータ管理
LLM推論はGPU/TPU等のアクセラレータが担うが、それらのオーケストレーション(ジョブスケジューリング、メモリ管理、データ前処理)はCPU側の責務となる。136コアの並列処理能力により、数十基のアクセラレータを単一CPUノードから効率的に管理できる。
2. コントロールプレーン処理
エージェントAIシステムでは、数千のエージェントが同時にタスクを実行する。各エージェントの状態管理、通信ルーティング、認証・認可の処理は、高いシングルスレッド性能と多コア並列性の両方を必要とする。Neoverse V3の3.2 GHzオールコア周波数は、この要件に合致する。
3. APIホスティング
LLMベースのAPIサービスは、推論処理そのもの以外にも、リクエストのルーティング、レスポンスのストリーミング、レート制限管理など多くのCPUバウンドな処理を伴う。高いメモリ帯域(800 GB/s超)とコア密度は、高スループットなAPIゲートウェイの運用に適している。
4. エッジ推論のホスト
bfloat16とINT8のネイティブ命令により、小〜中規模のモデル推論(例: エージェントの意図分類、ルーティング判定)をCPU上で直接実行することも可能である。アクセラレータを必要としない軽量推論タスクをCPUにオフロードすることで、GPUリソースの利用効率が向上する。
パートナーエコシステム
開発パートナー
Metaは開発パートナー として、複数世代にわたるArm AGI CPUの共同開発にコミットしている。MetaはArm AGI CPUを自社のカスタムアクセラレータ MTIA と組み合わせてAIインフラに展開する計画である。
採用企業
公式発表 に記載された採用企業は以下の通りである。
| 企業 | 用途(推定) |
|---|---|
| Meta | 開発パートナー。MTIAとの組み合わせでAIインフラ展開 |
| OpenAI | LLM推論インフラのホストCPU |
| Cerebras | ウェハスケールアクセラレータのホストCPU |
| Cloudflare | エッジAI推論インフラ |
| F5 | アプリケーションデリバリ・セキュリティ |
| Positron | AIアクセラレータとの統合 |
| Rebellions | AIチップ開発(韓国) |
| SAP | エンタープライズAIアプリケーション |
| SK Telecom | 通信インフラAI |
OEMパートナー
商用サーバーは ASRockRack、Lenovo、Supermicro から注文可能となっている。
導入ロードマップ
| 時期 | マイルストーン |
|---|---|
| 2026年3月 | 発表・注文受付開始 |
| 2026年後半 | 量産開始 |
| 2027年以降 | 次世代(Meta共同開発の第2世代) |
リファレンスデザインとして、1U OCP DC-MHS準拠のデュアルノードサーバー(272コア/1U)が提供される。OCP(Open Compute Project)準拠により、ハイパースケーラーの既存ラックインフラとの互換性が確保されている。
開発者・インフラエンジニアへの影響
ソフトウェアエコシステム
Armサーバーはすでに主要なLinuxディストリビューション、コンテナランタイム、Kubernetes等で十分なサポートがある。AWS Gravitonシリーズの普及により、Armネイティブなアプリケーション開発のノウハウは蓄積されている。
Arm AGI CPUはArmv9.2ベースのため、SVE2(Scalable Vector Extension 2)を活用したコードが性能を最大化する。主要な数値計算ライブラリ(OpenBLAS、BLAS、oneDNN等)はすでにSVE2対応を進めている。
コスト構造への影響
300W空冷設計は、AIデータセンターの構築コストに直接影響する。液冷システムが不要になることで、設備投資の削減と既存施設の活用が可能になる。また、36kWラックに8,160コアという密度は、1コアあたりのラックスペースコストを大幅に削減する。
注意点
- Arm AGI CPUはあくまで ホストCPU であり、LLM推論のメインアクセラレータではない。GPU/TPU/ASICとの併用が前提の設計となっている
- x86からArmへの移行には、一部のバイナリ互換性やライブラリ対応の確認が必要
- 2026年後半の量産開始まで、実環境での性能検証データは限定的
まとめ
Arm AGI CPUは、Armが35年間のIPライセンスモデルから自社シリコン製品へと踏み出した歴史的な製品である。
- 136コアNeoverse V3 をTSMC 3nmで製造し、300W空冷でx86比2倍以上のラック性能密度を実現
- Meta共同開発 で、OpenAI・Cerebras・Cloudflare等のAI企業が採用を表明
- エージェントAIの大規模並列インフラを主要ターゲットとし、アクセラレータ管理からAPIホスティングまで幅広いユースケースに対応
2026年後半の量産開始により、AIデータセンターのCPU選定においてx86一強の構図が変化する可能性がある。Armベースのクラウドインスタンスの選択肢拡大も見込まれるため、AIインフラ設計に関わるエンジニアにとって注視すべき動向である。
参考リンク
- Arm expands compute platform to silicon products in historic company first — Arm公式プレスリリース。発表概要・パートナー情報
- Announcing Arm AGI CPU: The silicon foundation for the agentic AI cloud era — Arm公式ブログ。設計思想・技術詳細
- Arm AGI CPU Product Page — 公式製品ページ。スペック表・リファレンスデザイン
- Arm moves beyond IP with AGI CPU silicon — Tom's Hardware — 技術解説・x86比較分析
- Arm unveils first AGI CPU on TSMC 3nm — TrendForce — 業界分析・市場影響



