0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Arm AGI CPU入門 — 136コアNeoverse V3で変わるAIデータセンターの全貌

0
Last updated at Posted at 2026-03-26

Arm AGI CPU — 136コアNeoverse V3チップの概要

はじめに

2026年3月24日、Arm Holdingsは同社35年の歴史で初となる自社設計シリコン製品 Arm AGI CPU を発表した。「AGI」は「Agentic General Infrastructure」の略で、AIエージェントの大規模並列処理を支えるデータセンターCPUとして設計されている。

従来Armはチップの「設計図(IP)」をライセンス提供するビジネスモデルで成長してきたが、今回は TSMC 3nmプロセスで製造した完成品シリコンを自社ブランドで販売する という歴史的な転換点となる。Metaを開発パートナーとし、OpenAI・Cerebras・Cloudflareなど主要AI企業が採用を表明している。

この記事では、Arm AGI CPUのアーキテクチャ・スペック・エコシステムを整理し、AIデータセンターにもたらす変化を解説する。

この記事で学べること

  • Arm AGI CPUの技術仕様とアーキテクチャの全体像
  • x86サーバーCPUとの性能密度比較
  • エージェントAIインフラにおける具体的なユースケース
  • パートナーエコシステムと導入ロードマップ

対象読者

  • AIインフラ・クラウドアーキテクチャに関わるエンジニア
  • サーバーハードウェアの選定に携わる方
  • Armベースデータセンターの動向に関心がある方

TL;DR

  • Arm初の自社シリコン。最大 136コアNeoverse V3 、TSMC 3nm、300W TDP
  • x86比 2倍以上のラック性能密度 (36kWラックに8,160コア)
  • Meta共同開発、OpenAI・Cerebras・Cloudflare等が採用。2026年後半に量産開始

Arm AGI CPUのアーキテクチャ構成

Arm AGI CPUのアーキテクチャ

コアとプロセッサ構成

Arm AGI CPUは、 Armv9.2命令セット に基づく最大136基のNeoverse V3コアを搭載する。主要な仕様は以下の通りである。

項目 仕様
コア数 最大136コア(Neoverse V3)
プロセスノード TSMC 3nm(N3P)
動作周波数 3.2 GHz(オールコア)/ 3.7 GHz(ブースト)
TDP 300W(空冷対応)
L2キャッシュ 2 MB/コア(専用)
システムキャッシュ 128 MB
命令セット Armv9.2(bfloat16、INT8 AI命令対応)
SIMD 2x 128-bit SVE2ユニット/コア

ダイは2チップレット構成で、コア間接続にはAMBA CHI Extension Linksが採用されている。各コアにbfloat16とINT8のAI推論命令が統合されているため、アクセラレータと連携するホストCPUとしてのAI処理効率が高い設計となっている。

メモリサブシステム

メモリ帯域はAIワークロードのボトルネックになりやすい要素だが、Arm AGI CPUは業界最高水準の構成を備えている。

項目 仕様
メモリタイプ DDR5 RDIMM
チャネル数 12チャネル
最大速度 DDR5-8800 MT/s
集約帯域 800 GB/s超
コアあたり帯域 6 GB/s
レイテンシ サブ100ナノ秒

12チャネルDDR5は、AMD EPYCの12チャネルと同等であり、Intel Xeonの8チャネルを大きく上回る。コアあたり6 GB/sの帯域は、LLM推論時のKVキャッシュ処理やエージェントのコンテキスト管理で威力を発揮する。

I/O接続

項目 仕様
PCIe 96レーン PCIe Gen6
CXL CXL 3.0 Type 3対応
ソケット 2ソケット構成対応
制御レーン 6x PCIe Gen4(各1レーン)

96レーンのPCIe Gen6は、最大8基のアクセラレータ(GPU/TPU/カスタムASIC)を接続可能な帯域を提供する。CXL 3.0 Type 3はメモリプーリングに対応し、複数ノード間でメモリリソースを柔軟に共有できる。

Arm AGI CPU vs x86のラック性能密度比較

x86との性能密度比較

Arm AGI CPUの最大の訴求点は、ラック単位での 性能密度 である。

ラック構成の比較

項目 Arm AGI CPU x86サーバー(参考)
フォームファクタ 1U OCP DC-MHS デュアルノード 2U(一般的なデュアルソケット)
1Uあたりコア数 272コア(136 x 2ノード) 128〜192コア(参考値)
TDP/ノード 300W 400〜500W
36kWラック搭載数 30台(1U) 15〜18台(2U)
ラックあたりコア数 8,160コア 1,920〜3,456コア(参考値)

Armの公式発表 では「x86ベースの同等構成と比較して ラックあたり2倍以上の性能 」と主張している。300Wという空冷対応のTDPにより、1Uシャーシへの搭載が可能となり、同じ36kWの電力バジェット内で圧倒的なコア密度を実現している。

エネルギー効率の意味

データセンターの電力コストはAIワークロードの拡大に伴い急増している。Arm AGI CPUの300W空冷設計は、液冷インフラが不要という運用上の大きなメリットがある。既存のデータセンター設備をそのまま活用しながら、AI処理能力を大幅にスケールできる。

エージェントAIインフラにおけるArm AGI CPUの役割

エージェントAIインフラにおけるユースケース

Arm AGI CPUの「AGI = Agentic General Infrastructure」という命名が示す通り、このプロセッサはAIエージェントの大規模運用を主要ターゲットとしている。

1. アクセラレータ管理

LLM推論はGPU/TPU等のアクセラレータが担うが、それらのオーケストレーション(ジョブスケジューリング、メモリ管理、データ前処理)はCPU側の責務となる。136コアの並列処理能力により、数十基のアクセラレータを単一CPUノードから効率的に管理できる。

2. コントロールプレーン処理

エージェントAIシステムでは、数千のエージェントが同時にタスクを実行する。各エージェントの状態管理、通信ルーティング、認証・認可の処理は、高いシングルスレッド性能と多コア並列性の両方を必要とする。Neoverse V3の3.2 GHzオールコア周波数は、この要件に合致する。

3. APIホスティング

LLMベースのAPIサービスは、推論処理そのもの以外にも、リクエストのルーティング、レスポンスのストリーミング、レート制限管理など多くのCPUバウンドな処理を伴う。高いメモリ帯域(800 GB/s超)とコア密度は、高スループットなAPIゲートウェイの運用に適している。

4. エッジ推論のホスト

bfloat16とINT8のネイティブ命令により、小〜中規模のモデル推論(例: エージェントの意図分類、ルーティング判定)をCPU上で直接実行することも可能である。アクセラレータを必要としない軽量推論タスクをCPUにオフロードすることで、GPUリソースの利用効率が向上する。

パートナーエコシステム

開発パートナー

Metaは開発パートナー として、複数世代にわたるArm AGI CPUの共同開発にコミットしている。MetaはArm AGI CPUを自社のカスタムアクセラレータ MTIA と組み合わせてAIインフラに展開する計画である。

採用企業

公式発表 に記載された採用企業は以下の通りである。

企業 用途(推定)
Meta 開発パートナー。MTIAとの組み合わせでAIインフラ展開
OpenAI LLM推論インフラのホストCPU
Cerebras ウェハスケールアクセラレータのホストCPU
Cloudflare エッジAI推論インフラ
F5 アプリケーションデリバリ・セキュリティ
Positron AIアクセラレータとの統合
Rebellions AIチップ開発(韓国)
SAP エンタープライズAIアプリケーション
SK Telecom 通信インフラAI

OEMパートナー

商用サーバーは ASRockRack、Lenovo、Supermicro から注文可能となっている。

導入ロードマップ

時期 マイルストーン
2026年3月 発表・注文受付開始
2026年後半 量産開始
2027年以降 次世代(Meta共同開発の第2世代)

リファレンスデザインとして、1U OCP DC-MHS準拠のデュアルノードサーバー(272コア/1U)が提供される。OCP(Open Compute Project)準拠により、ハイパースケーラーの既存ラックインフラとの互換性が確保されている。

開発者・インフラエンジニアへの影響

ソフトウェアエコシステム

Armサーバーはすでに主要なLinuxディストリビューション、コンテナランタイム、Kubernetes等で十分なサポートがある。AWS Gravitonシリーズの普及により、Armネイティブなアプリケーション開発のノウハウは蓄積されている。

Arm AGI CPUはArmv9.2ベースのため、SVE2(Scalable Vector Extension 2)を活用したコードが性能を最大化する。主要な数値計算ライブラリ(OpenBLAS、BLAS、oneDNN等)はすでにSVE2対応を進めている。

コスト構造への影響

300W空冷設計は、AIデータセンターの構築コストに直接影響する。液冷システムが不要になることで、設備投資の削減と既存施設の活用が可能になる。また、36kWラックに8,160コアという密度は、1コアあたりのラックスペースコストを大幅に削減する。

注意点

  • Arm AGI CPUはあくまで ホストCPU であり、LLM推論のメインアクセラレータではない。GPU/TPU/ASICとの併用が前提の設計となっている
  • x86からArmへの移行には、一部のバイナリ互換性やライブラリ対応の確認が必要
  • 2026年後半の量産開始まで、実環境での性能検証データは限定的

まとめ

Arm AGI CPUは、Armが35年間のIPライセンスモデルから自社シリコン製品へと踏み出した歴史的な製品である。

  • 136コアNeoverse V3 をTSMC 3nmで製造し、300W空冷でx86比2倍以上のラック性能密度を実現
  • Meta共同開発 で、OpenAI・Cerebras・Cloudflare等のAI企業が採用を表明
  • エージェントAIの大規模並列インフラを主要ターゲットとし、アクセラレータ管理からAPIホスティングまで幅広いユースケースに対応

2026年後半の量産開始により、AIデータセンターのCPU選定においてx86一強の構図が変化する可能性がある。Armベースのクラウドインスタンスの選択肢拡大も見込まれるため、AIインフラ設計に関わるエンジニアにとって注視すべき動向である。

参考リンク

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?