はじめに
近年、AI技術の急速な普及に伴い、NPU(Neural Processing Unit) という言葉を耳にする機会が増えています。スマートフォンからPC、エッジデバイスまで、あらゆる場面でAI処理の効率化を実現するNPUは、今後のAI時代を支える重要なテクノロジーです。
本記事では、NPUの基本概念から、NPUボード、GPUとの違い、そして特に 中国の代表的なNPUチップメーカー5社(Horizon Robotics、Axera、Rockchip、Sophgo、Kendryte) について解説します。
1. NPU(ニューラルプロセッシングユニット)とは?
1.1 NPUの定義
NPU(Neural Processing Unit / Neural network Processing Unit) とは、人工知能(AI)処理、特にニューラルネットワークの演算に特化したプロセッサです。
人間の脳の神経細胞(ニューロン)の働きを模した構造を持ち、ディープラーニングや機械学習の「推論」処理を高速かつ低消費電力で実行できるよう設計されています。従来のCPUやGPUが汎用的な計算処理を行うのに対し、NPUはAI処理に必要な行列演算や畳み込み演算などの特定の計算パターンに最適化されており、「AIチップ」や「AIアクセラレータ」とも呼ばれます。
1.2 NPUの主な特徴
| 特徴 | 説明 |
|---|---|
| 高い並列処理性能 | 数千〜数万の演算ユニットを並列動作させ、AI処理に必要な大量の計算を同時に実行 |
| 低消費電力 | CPUやGPUと比べて消費電力が1/10〜1/100程度。バッテリー駆動デバイスに最適 |
| AI推論に特化 | 学習済みモデルを使って結果を出す「推論処理」において圧倒的な効率を発揮 |
| リアルタイム処理 | 顔認識、音声認識、画像認識などをローカルでリアルタイムに実行可能 |
| プライバシー保護 | データをクラウドに送信せずにデバイス上で処理するため、セキュリティリスクを低減 |
1.3 NPUの歴史
NPUの歴史は比較的新しく、2017年がターニングポイントとなりました。
2016年 ─ GoogleがAI専用チップ「TPU(Tensor Processing Unit)」を発表
2017年 ─ HuaweiがNPU搭載スマホ向けSoC「Kirin 970」を世界初リリース
2017年 ─ AppleがiPhone 8/Xに「Apple Neural Engine」搭載のA11 Bionicを導入
2020年 ─ AppleがMacBook向けに「M1」チップを発表、16コアのNeural Engineを搭載
2024年〜 ─ Intel Core Ultra、AMD Ryzen AIなど、PC向けCPUへのNPU統合が本格化
2. NPUボードとは?
2.1 NPUボードの概要
NPUボードとは、NPU(AI処理専用チップ)を搭載した開発ボードや拡張ボードのことです。エッジAI(Edge AI) の開発・実装において中核的な役割を果たし、クラウドに頼らずにデバイス側でAI処理を実行する「オンデバイスAI」を実現します。
2.2 エッジAIとNPUボードの関係
エッジAIとは、データ処理をクラウドではなくデバイス側で行う技術です。これにより以下のメリットが得られます:
- リアルタイム処理:ネットワーク遅延なしで即時応答
- プライバシー保護:機密データをクラウドに送信不要
- オフライン動作:インターネット接続がなくても動作
- コスト削減:クラウド利用料金の削減
NPUボードはエッジAIの中核として、スマートホーム、産業用IoT、自動運転車、医療機器など、多くの分野で活用されています。
3. GPUとNPUの違い
3.1 基本的な設計思想の違い
GPU(Graphics Processing Unit)とNPU(Neural Processing Unit)は、どちらも並列処理に優れたプロセッサですが、設計思想と最適化された用途が根本的に異なります。
重要なポイント:NPUはエッジ側(端末側)でAI処理(推論)を行うための装置であり、AIの主戦場たるサーバ側でのAI処理(学習)を担うGPUとはそもそもの目的が違います。
| 項目 | GPU | NPU |
|---|---|---|
| 本来の用途 | グラフィックス描画・3D処理 | AI推論処理 |
| AI処理の得意分野 | 学習(トレーニング) | 推論(インファレンス) |
| 演算精度 | 32ビット浮動小数点中心 | 4〜8ビット整数演算中心 |
| 消費電力 | 高い(数十〜数百W) | 低い(数W〜数十W) |
| 主な実装場所 | データセンター、ゲーミングPC | スマホ、PC、エッジデバイス |
| 汎用性 | 高い(多用途に対応) | 低い(AI特化) |
| 代表製品 | NVIDIA H100/A100 | Apple Neural Engine、Qualcomm Hexagon |
3.2 用途による使い分け
GPUとNPUは競合するものではなく、相互補完的な関係にあります。
- GPUが適する場面:大規模言語モデルの学習、3Dレンダリング、科学技術計算、ゲーム
- NPUが適する場面:スマホでの顔認識、音声アシスタント、リアルタイム翻訳、バッテリー駆動デバイス
- 両方が連携する場面:AI PC(CPU+GPU+NPUの三位一体構成)、データセンターでのAI推論サービス
3.3 なぜNPUが必要なのか
GPUでもAI処理は可能ですが、NPUには以下の明確な優位性があります:
- 電力効率:同じAI処理をGPUで行う場合と比べ、消費電力を大幅に削減。モバイルデバイスのバッテリー持続時間を向上
- 専用設計:行列演算や活性化関数など、AI特有の処理に最適化されたハードウェア構造
- 低遅延:クラウドへのデータ送信不要で、リアルタイム処理が可能
4. 中国NPUチップメーカー5社の詳細分析
中国では、米国による半導体輸出規制を背景に、NPUを含むAI半導体の国産化が急速に進んでいます。ここでは、特にエッジAI分野で注目される5社を詳しく解説します。
4.1 Horizon Robotics(地平線)
概要
Horizon Robotics(地平線機器人) は2015年に元Baiduの自動運転部門責任者である余凱(Yu Kai)氏によって設立された、中国を代表する自動運転向けAIチップ企業です。Intel、BYD、CATL、フォルクスワーゲンなど錚々たる企業から投資を受けています。
主要製品:BPU(Brain Processing Unit)
Horizon Roboticsは独自のAIプロセッサアーキテクチャ「BPU(Brain Processing Unit)」を開発しています。
| 製品名 | NPU性能 | 特徴 |
|---|---|---|
| Journey 2 | 4 TOPS @2W | ADAS向け。2020年量産開始 |
| Journey 3 | 5 TOPS | 第2世代SoC。Li Auto ONEに採用 |
| Journey 5 | 128 TOPS | Bayesian BPUアーキテクチャ。ISO 26262 ASIL-B認証取得 |
| Journey 6P | 560 TOPS | Nash BPUアーキテクチャ。Transformer対応。2025年Q3量産予定 |
| Sunrise 3 | 5 TOPS | AIoT向け。Cortex-A53搭載 |
BPUアーキテクチャの進化
├── Gauss (1.0) ─ Journey 1.0
├── Bernoulli (2.0) ─ Journey 2/3, Sunrise 3
├── Bayesian (3.0) ─ Journey 5
└── Nash (4.0) ─ Journey 6シリーズ
採用実績
BYD、長安汽車、SAIC、Li Auto、GAC、Great Wall Motor、フォルクスワーゲン(CARIAD)など多数の自動車メーカーが採用。Journey 6シリーズはBosch、Densoなどの大手Tier1サプライヤーからも受注を獲得しています。
4.2 Axera(爱芯元智)
概要
Axera(爱芯元智) は、AI視覚認識チップと基盤コンピューティングプラットフォームを開発する中国企業です。スマートシティ、スマート教育、スマート製造などの分野向けに高性能・低消費電力のAI SoCを提供しています。
主要製品:AX6シリーズ
Axeraは独自の混合精度NPU「AXNeutron」とAI-ISP「Aixin Smart Eye」を開発しています。
| 製品名 | NPU性能 | CPU | 特徴 |
|---|---|---|---|
| AX620A | 3.6 TOPS @INT8 / 14.4 TOPS @INT4 | 4x Cortex-A7 | 4K対応AI ISP搭載。セキュリティカメラ向け |
| AX630C | Neutron 4.0 NPU | 2x Cortex-A53 | PSA Certified Level 1取得 |
| AX650N | 10.8 TOPS @INT8 / 43.2 TOPS @INT4 | 8x Cortex-A55 | 8K@30fps対応。Transformer対応 |
| AX650A | 18.0 TOPS @INT8 / 72.0 TOPS @INT4 | 8x Cortex-A55 | AX650シリーズ最上位 |
技術的特徴
# AX650NでのTransformer推論性能例
モデル: SwinT
性能: 361 FPS
精度: 80.45%
電力効率: 199 FPS/W
量子化: PTQ(Post Training Quantization)対応
AX650Nは、ViT/DeiT、Swin/SwinV2、DETR、DINOv2など多数のTransformerモデルをサポートし、エッジデバイスでの高効率な推論を実現しています。
ツールチェーン
Pulsar2:Axera独自開発のニューラルネットワークコンパイラ。変換、量子化、コンパイル、ヘテロジニアス処理を一括で行い、AX6シリーズの性能を最大限に引き出します。
4.3 Rockchip(瑞芯微)
概要
Rockchip(瑞芯微电子) は、中国を代表するAIoT SoCサプライヤーです。業界で最も早くNPUをSoCに統合したメーカーの一つであり、タブレット、スマートTV、IoTシステム、エッジAIアプリケーションなど幅広い分野で採用されています。
主要製品:RKシリーズ
| 製品名 | NPU性能 | CPU | 特徴 |
|---|---|---|---|
| RV1103/RV1106 | 0.5 TOPS | 単コアCortex-A7/RISC-V | 超低消費電力。IoTカメラ向け |
| RK3562 | 1 TOPS | 4x Cortex-A53 | エントリーレベルAIoT |
| RK3566/RK3568 | 1 TOPS | 4x Cortex-A55 | タブレット、NAS向け |
| RK3576 | 6 TOPS | 4x Cortex-A72 + 4x A53 | 新世代AIプロセッサ。スパース重み対応 |
| RK3588/RK3588S | 6 TOPS | 4x Cortex-A76 + 4x A55 | フラッグシップ。8K対応 |
RK3588 NPU詳細スペック
RK3588 NPU仕様
├── アーキテクチャ: 3コア NPU(トリプルコア構成)
├── 演算性能: 6 TOPS @INT8
├── サポート精度: INT4, INT8, INT16, FP16
├── 対応フレームワーク: TensorFlow, PyTorch, ONNX, Caffe, Darknet
├── メモリ: SRAM上への重み/特徴マップ配置対応
└── マルチコア: 単一モデルの複数コア同時実行対応
採用ボード例
Radxa ROCK 5B、Orange Pi 5、Khadas Edge2、Firefly ITX-3588Jなど、多数のSBC(シングルボードコンピュータ)で採用されています。
4.4 Sophgo(算能科技)
概要
Sophgo(算能科技、旧SOPHON/Bitmain) は、RISC-VとTPU(Tensor Processing Unit)を組み合わせたユニークなアプローチでAIチップを開発する中国企業です。「クラウド・エッジ・端末」をカバーするフルスタック製品を提供しています。
主要製品
| 製品名 | NPU/TPU性能 | アーキテクチャ | 特徴 |
|---|---|---|---|
| BM1684 | 17.6 TOPS @INT8 | Arm | 第3世代TPU。32ch FHDデコード対応 |
| BM1684X | 高性能TPU | Arm + TPU-MLIR | 次世代深層学習プロセッサ |
| CV1800B | 0.5 TOPS @INT8 | RISC-V + Arm | Milk-V Duoに採用 |
| SG2000 | 0.5 TOPS @INT8 | RISC-V + Arm + 8051 | 4種類のプロセッサアーキテクチャ統合 |
| SG2002 | 1 TOPS @INT8 | RISC-V + Arm + 8051 | SG2000の上位版 |
| SG2042 | - | 64コア RISC-V @2GHz | サーバーグレードRISC-V CPU |
SG2000/SG2002の特徴
SG2000/SG2002は非常にユニークなSoCで、4種類のプロセッサアーキテクチャを1チップに統合しています:
SG2000/SG2002 アーキテクチャ
├── RISC-V (T-Head C906)
│ ├── 1GHz コア(Linux用)
│ └── 700MHz コア(RTOS用)
├── Arm Cortex-A53 @1GHz
├── Intel 8051互換 MCU @25-300MHz
└── 自社開発 TPU @0.5-1 TOPS
採用ボード例
- SE5/SM5 Mini:BM1684搭載エッジサーバー
- Milk-V Duo:CV1800B搭載超小型開発ボード($9〜)
- Milk-V Pioneer:SG2042搭載64コアRISC-Vワークステーション
4.5 Kendryte(勘智)by Canaan
概要
Kendryte(勘智) は、Canaan(嘉楠科技、NASDAQ: CAN)が開発するRISC-VベースのAIoTチップブランドです。2018年に発売されたK210は、世界初のRISC-VベースのエッジAIチップとして話題を呼びました。
主要製品:Kシリーズ
| 製品名 | NPU性能 | CPU | 特徴 |
|---|---|---|---|
| K210 | 0.5 TOPS | 2x RISC-V @400MHz | 世界初のRISC-VエッジAIチップ。0.3W低消費電力 |
| K510 | 3 TOPS | 3x RISC-V @800MHz | K210の3倍性能。DSP拡張対応 |
| K230 | 6 TOPS @INT8 | 2x RISC-V C908 | 最新世代。Transformer対応。MicroPython対応 |
K230の詳細スペック
K230 仕様
├── CPU: 2x RISC-V C908 (1.6GHz + 800MHz)
├── KPU (Knowledge Process Unit)
│ ├── INT8: 6 TOPS
│ └── INT16: 対応
├── DPU: 3D構造光深度計算 @1280×800 30fps
├── VPU: H.264/H.265/JPEG @4K40fps
├── ISP: AI 2D Engine, 2.5D GPU
└── 対応モデル: ResNet50 ≥85fps, MobileNet_v2 ≥670fps, YOLOv5S ≥38fps
効率比較
| チップ | 効率 (FPS/TOPS) |
|---|---|
| K210 | 86 |
| K510 | 133 |
| K230 | 341 |
K230は、MAC利用率の改善により、K210比で約4倍の効率を実現しています。
採用ボード例
- CanMV K230:$49.99で購入可能な公式開発ボード
- Sipeed Maix シリーズ:K210搭載の各種開発ボード
- Grove AI HAT:Raspberry Pi向け拡張ボード
5. 5社の比較まとめ
| メーカー | 主要市場 | NPU名称 | 最大性能 | 特徴 |
|---|---|---|---|---|
| Horizon | 自動運転 | BPU | 560 TOPS | 自動車メーカーとの深い連携 |
| Axera | セキュリティ/IoT | AXNeutron | 72 TOPS | AI-ISP統合。Transformer対応 |
| Rockchip | 汎用AIoT | RKNPU | 6 TOPS | 豊富なエコシステム。SBC市場で人気 |
| Sophgo | エッジ〜クラウド | TPU | 17.6 TOPS | RISC-V推進。フルスタック製品 |
| Kendryte | 教育/IoT | KPU | 6 TOPS | RISC-V先駆者。MicroPython対応 |
6. なぜ中国にNPU企業が多いのか
6.1 米国による半導体輸出規制
最も重要な要因は、米国による対中半導体輸出規制です。2022年以降、NVIDIAやAMDの高性能AI半導体(H100、A100など)の中国への輸出が禁止・制限されました。これにより、中国企業は海外製の先端AIチップを入手できなくなり、国産化への強いインセンティブが生まれました。
6.2 政府による大規模支援
中国政府は「中国製造2025」政策の下、半導体の国産化を国家戦略として推進しています。
- 国家集積回路産業投資基金(大基金):数兆円規模の政府系ファンド
- 科創板(スター・マーケット):ハイテク企業向け株式市場
- 政府調達での国産優先:政府系機関や大手IT企業に国産チップ採用を推奨
6.3 巨大な国内市場
中国は世界最大の半導体消費市場であり、自動運転、スマートシティ、監視システム、金融、医療など、AIを必要とする産業が急成長しています。
7. まとめ
NPU(Neural Processing Unit)は、AI時代を支える次世代プロセッサとして急速に普及しています。
- NPU:AI推論処理に特化した低消費電力プロセッサ
- NPUボード:エッジAIの中核として、オンデバイスAIを実現
- GPU vs NPU:学習はGPU、推論はNPU。相互補完の関係
- 中国NPU企業:米中対立を背景に急成長。独自のエコシステムを構築中
特に中国の5社(Horizon、Axera、Rockchip、Sophgo、Kendryte)は、それぞれ異なる市場セグメントで強みを持ち、活発な開発を続けています。RISC-Vの採用やTransformerモデルへの対応など、技術的にも興味深い動きが多く、今後の展開が注目されます。