Arm AGI CPU入門 — 136コアNeoverse V3で変わるAIデータセンターの全貌

Last updated at 2026-03-26Posted at 2026-03-26

はじめに

2026年3月24日、Arm Holdingsは同社35年の歴史で初となる自社設計シリコン製品 Arm AGI CPU を発表した。「AGI」は「Agentic General Infrastructure」の略で、AIエージェントの大規模並列処理を支えるデータセンターCPUとして設計されている。

従来Armはチップの「設計図（IP）」をライセンス提供するビジネスモデルで成長してきたが、今回は TSMC 3nmプロセスで製造した完成品シリコンを自社ブランドで販売するという歴史的な転換点となる。Metaを開発パートナーとし、OpenAI・Cerebras・Cloudflareなど主要AI企業が採用を表明している。

この記事では、Arm AGI CPUのアーキテクチャ・スペック・エコシステムを整理し、AIデータセンターにもたらす変化を解説する。

この記事で学べること

Arm AGI CPUの技術仕様とアーキテクチャの全体像
x86サーバーCPUとの性能密度比較
エージェントAIインフラにおける具体的なユースケース
パートナーエコシステムと導入ロードマップ

対象読者

AIインフラ・クラウドアーキテクチャに関わるエンジニア
サーバーハードウェアの選定に携わる方
Armベースデータセンターの動向に関心がある方

TL;DR

Arm初の自社シリコン。最大 136コアNeoverse V3 、TSMC 3nm、300W TDP
x86比 2倍以上のラック性能密度 （36kWラックに8,160コア）
Meta共同開発、OpenAI・Cerebras・Cloudflare等が採用。2026年後半に量産開始

Arm AGI CPUのアーキテクチャ

コアとプロセッサ構成

Arm AGI CPUは、 Armv9.2命令セットに基づく最大136基のNeoverse V3コアを搭載する。主要な仕様は以下の通りである。

項目	仕様
コア数	最大136コア（Neoverse V3）
プロセスノード	TSMC 3nm（N3P）
動作周波数	3.2 GHz（オールコア）/ 3.7 GHz（ブースト）
TDP	300W（空冷対応）
L2キャッシュ	2 MB/コア（専用）
システムキャッシュ	128 MB
命令セット	Armv9.2（bfloat16、INT8 AI命令対応）
SIMD	2x 128-bit SVE2ユニット/コア

ダイは2チップレット構成で、コア間接続にはAMBA CHI Extension Linksが採用されている。各コアにbfloat16とINT8のAI推論命令が統合されているため、アクセラレータと連携するホストCPUとしてのAI処理効率が高い設計となっている。

メモリサブシステム

メモリ帯域はAIワークロードのボトルネックになりやすい要素だが、Arm AGI CPUは業界最高水準の構成を備えている。

項目	仕様
メモリタイプ	DDR5 RDIMM
チャネル数	12チャネル
最大速度	DDR5-8800 MT/s
集約帯域	800 GB/s超
コアあたり帯域	6 GB/s
レイテンシ	サブ100ナノ秒

12チャネルDDR5は、AMD EPYCの12チャネルと同等であり、Intel Xeonの8チャネルを大きく上回る。コアあたり6 GB/sの帯域は、LLM推論時のKVキャッシュ処理やエージェントのコンテキスト管理で威力を発揮する。

I/O接続

項目	仕様
PCIe	96レーン PCIe Gen6
CXL	CXL 3.0 Type 3対応
ソケット	2ソケット構成対応
制御レーン	6x PCIe Gen4（各1レーン）

96レーンのPCIe Gen6は、最大8基のアクセラレータ（GPU/TPU/カスタムASIC）を接続可能な帯域を提供する。CXL 3.0 Type 3はメモリプーリングに対応し、複数ノード間でメモリリソースを柔軟に共有できる。

x86との性能密度比較

Arm AGI CPUの最大の訴求点は、ラック単位での 性能密度 である。

ラック構成の比較

項目	Arm AGI CPU	x86サーバー（参考）
フォームファクタ	1U OCP DC-MHS デュアルノード	2U（一般的なデュアルソケット）
1Uあたりコア数	272コア（136 x 2ノード）	128〜192コア（参考値）
TDP/ノード	300W	400〜500W
36kWラック搭載数	30台（1U）	15〜18台（2U）
ラックあたりコア数	8,160コア	1,920〜3,456コア（参考値）

Armの公式発表では「x86ベースの同等構成と比較して ラックあたり2倍以上の性能 」と主張している。300Wという空冷対応のTDPにより、1Uシャーシへの搭載が可能となり、同じ36kWの電力バジェット内で圧倒的なコア密度を実現している。

エネルギー効率の意味

データセンターの電力コストはAIワークロードの拡大に伴い急増している。Arm AGI CPUの300W空冷設計は、液冷インフラが不要という運用上の大きなメリットがある。既存のデータセンター設備をそのまま活用しながら、AI処理能力を大幅にスケールできる。

エージェントAIインフラにおけるユースケース

Arm AGI CPUの「AGI = Agentic General Infrastructure」という命名が示す通り、このプロセッサはAIエージェントの大規模運用を主要ターゲットとしている。

1. アクセラレータ管理

LLM推論はGPU/TPU等のアクセラレータが担うが、それらのオーケストレーション（ジョブスケジューリング、メモリ管理、データ前処理）はCPU側の責務となる。136コアの並列処理能力により、数十基のアクセラレータを単一CPUノードから効率的に管理できる。

2. コントロールプレーン処理

エージェントAIシステムでは、数千のエージェントが同時にタスクを実行する。各エージェントの状態管理、通信ルーティング、認証・認可の処理は、高いシングルスレッド性能と多コア並列性の両方を必要とする。Neoverse V3の3.2 GHzオールコア周波数は、この要件に合致する。

3. APIホスティング

LLMベースのAPIサービスは、推論処理そのもの以外にも、リクエストのルーティング、レスポンスのストリーミング、レート制限管理など多くのCPUバウンドな処理を伴う。高いメモリ帯域（800 GB/s超）とコア密度は、高スループットなAPIゲートウェイの運用に適している。

4. エッジ推論のホスト

bfloat16とINT8のネイティブ命令により、小〜中規模のモデル推論（例: エージェントの意図分類、ルーティング判定）をCPU上で直接実行することも可能である。アクセラレータを必要としない軽量推論タスクをCPUにオフロードすることで、GPUリソースの利用効率が向上する。

パートナーエコシステム

開発パートナー

Metaは開発パートナーとして、複数世代にわたるArm AGI CPUの共同開発にコミットしている。MetaはArm AGI CPUを自社のカスタムアクセラレータ MTIA と組み合わせてAIインフラに展開する計画である。

採用企業

公式発表に記載された採用企業は以下の通りである。

企業	用途（推定）
Meta	開発パートナー。MTIAとの組み合わせでAIインフラ展開
OpenAI	LLM推論インフラのホストCPU
Cerebras	ウェハスケールアクセラレータのホストCPU
Cloudflare	エッジAI推論インフラ
F5	アプリケーションデリバリ・セキュリティ
Positron	AIアクセラレータとの統合
Rebellions	AIチップ開発（韓国）
SAP	エンタープライズAIアプリケーション
SK Telecom	通信インフラAI

OEMパートナー

商用サーバーは ASRockRack、Lenovo、Supermicro から注文可能となっている。

導入ロードマップ

時期	マイルストーン
2026年3月	発表・注文受付開始
2026年後半	量産開始
2027年以降	次世代（Meta共同開発の第2世代）

リファレンスデザインとして、1U OCP DC-MHS準拠のデュアルノードサーバー（272コア/1U）が提供される。OCP（Open Compute Project）準拠により、ハイパースケーラーの既存ラックインフラとの互換性が確保されている。

開発者・インフラエンジニアへの影響

ソフトウェアエコシステム

Armサーバーはすでに主要なLinuxディストリビューション、コンテナランタイム、Kubernetes等で十分なサポートがある。AWS Gravitonシリーズの普及により、Armネイティブなアプリケーション開発のノウハウは蓄積されている。

Arm AGI CPUはArmv9.2ベースのため、SVE2（Scalable Vector Extension 2）を活用したコードが性能を最大化する。主要な数値計算ライブラリ（OpenBLAS、BLAS、oneDNN等）はすでにSVE2対応を進めている。

コスト構造への影響

300W空冷設計は、AIデータセンターの構築コストに直接影響する。液冷システムが不要になることで、設備投資の削減と既存施設の活用が可能になる。また、36kWラックに8,160コアという密度は、1コアあたりのラックスペースコストを大幅に削減する。

注意点

Arm AGI CPUはあくまで ホストCPU であり、LLM推論のメインアクセラレータではない。GPU/TPU/ASICとの併用が前提の設計となっている
x86からArmへの移行には、一部のバイナリ互換性やライブラリ対応の確認が必要
2026年後半の量産開始まで、実環境での性能検証データは限定的

まとめ

Arm AGI CPUは、Armが35年間のIPライセンスモデルから自社シリコン製品へと踏み出した歴史的な製品である。

136コアNeoverse V3 をTSMC 3nmで製造し、300W空冷でx86比2倍以上のラック性能密度を実現
Meta共同開発 で、OpenAI・Cerebras・Cloudflare等のAI企業が採用を表明
エージェントAIの大規模並列インフラを主要ターゲットとし、アクセラレータ管理からAPIホスティングまで幅広いユースケースに対応

2026年後半の量産開始により、AIデータセンターのCPU選定においてx86一強の構図が変化する可能性がある。Armベースのクラウドインスタンスの選択肢拡大も見込まれるため、AIインフラ設計に関わるエンジニアにとって注視すべき動向である。

参考リンク

Arm expands compute platform to silicon products in historic company first — Arm公式プレスリリース。発表概要・パートナー情報
Announcing Arm AGI CPU: The silicon foundation for the agentic AI cloud era — Arm公式ブログ。設計思想・技術詳細
Arm AGI CPU Product Page — 公式製品ページ。スペック表・リファレンスデザイン
Arm moves beyond IP with AGI CPU silicon — Tom's Hardware — 技術解説・x86比較分析
Arm unveils first AGI CPU on TSMC 3nm — TrendForce — 業界分析・市場影響

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up