中華NPUボード Advent Calendar 2025

NPUボードとは？

Last updated at 2025-11-30Posted at 2025-11-30

はじめに

近年、AI技術の急速な普及に伴い、NPU（Neural Processing Unit） という言葉を耳にする機会が増えています。スマートフォンからPC、エッジデバイスまで、あらゆる場面でAI処理の効率化を実現するNPUは、今後のAI時代を支える重要なテクノロジーです。

本記事では、NPUの基本概念から、NPUボード、GPUとの違い、そして特に 中国の代表的なNPUチップメーカー5社（Horizon Robotics、Axera、Rockchip、Sophgo、Kendryte） について解説します。

1. NPU（ニューラルプロセッシングユニット）とは？

1.1 NPUの定義

NPU（Neural Processing Unit / Neural network Processing Unit） とは、人工知能（AI）処理、特にニューラルネットワークの演算に特化したプロセッサです。

人間の脳の神経細胞（ニューロン）の働きを模した構造を持ち、ディープラーニングや機械学習の「推論」処理を高速かつ低消費電力で実行できるよう設計されています。従来のCPUやGPUが汎用的な計算処理を行うのに対し、NPUはAI処理に必要な行列演算や畳み込み演算などの特定の計算パターンに最適化されており、「AIチップ」や「AIアクセラレータ」とも呼ばれます。

1.2 NPUの主な特徴

特徴	説明
高い並列処理性能	数千〜数万の演算ユニットを並列動作させ、AI処理に必要な大量の計算を同時に実行
低消費電力	CPUやGPUと比べて消費電力が1/10〜1/100程度。バッテリー駆動デバイスに最適
AI推論に特化	学習済みモデルを使って結果を出す「推論処理」において圧倒的な効率を発揮
リアルタイム処理	顔認識、音声認識、画像認識などをローカルでリアルタイムに実行可能
プライバシー保護	データをクラウドに送信せずにデバイス上で処理するため、セキュリティリスクを低減

1.3 NPUの歴史

NPUの歴史は比較的新しく、2017年がターニングポイントとなりました。

2016年 ─ GoogleがAI専用チップ「TPU（Tensor Processing Unit）」を発表
2017年 ─ HuaweiがNPU搭載スマホ向けSoC「Kirin 970」を世界初リリース
2017年 ─ AppleがiPhone 8/Xに「Apple Neural Engine」搭載のA11 Bionicを導入
2020年 ─ AppleがMacBook向けに「M1」チップを発表、16コアのNeural Engineを搭載
2024年〜 ─ Intel Core Ultra、AMD Ryzen AIなど、PC向けCPUへのNPU統合が本格化

2. NPUボードとは？

2.1 NPUボードの概要

NPUボードとは、NPU（AI処理専用チップ）を搭載した開発ボードや拡張ボードのことです。エッジAI（Edge AI） の開発・実装において中核的な役割を果たし、クラウドに頼らずにデバイス側でAI処理を実行する「オンデバイスAI」を実現します。

2.2 エッジAIとNPUボードの関係

エッジAIとは、データ処理をクラウドではなくデバイス側で行う技術です。これにより以下のメリットが得られます：

リアルタイム処理：ネットワーク遅延なしで即時応答
プライバシー保護：機密データをクラウドに送信不要
オフライン動作：インターネット接続がなくても動作
コスト削減：クラウド利用料金の削減

NPUボードはエッジAIの中核として、スマートホーム、産業用IoT、自動運転車、医療機器など、多くの分野で活用されています。

3. GPUとNPUの違い

3.1 基本的な設計思想の違い

GPU（Graphics Processing Unit）とNPU（Neural Processing Unit）は、どちらも並列処理に優れたプロセッサですが、設計思想と最適化された用途が根本的に異なります。

重要なポイント：NPUはエッジ側（端末側）でAI処理（推論）を行うための装置であり、AIの主戦場たるサーバ側でのAI処理（学習）を担うGPUとはそもそもの目的が違います。

項目	GPU	NPU
本来の用途	グラフィックス描画・3D処理	AI推論処理
AI処理の得意分野	学習（トレーニング）	推論（インファレンス）
演算精度	32ビット浮動小数点中心	4〜8ビット整数演算中心
消費電力	高い（数十〜数百W）	低い（数W〜数十W）
主な実装場所	データセンター、ゲーミングPC	スマホ、PC、エッジデバイス
汎用性	高い（多用途に対応）	低い（AI特化）
代表製品	NVIDIA H100/A100	Apple Neural Engine、Qualcomm Hexagon

3.2 用途による使い分け

GPUとNPUは競合するものではなく、相互補完的な関係にあります。

GPUが適する場面：大規模言語モデルの学習、3Dレンダリング、科学技術計算、ゲーム
NPUが適する場面：スマホでの顔認識、音声アシスタント、リアルタイム翻訳、バッテリー駆動デバイス
両方が連携する場面：AI PC（CPU＋GPU＋NPUの三位一体構成）、データセンターでのAI推論サービス

3.3 なぜNPUが必要なのか

GPUでもAI処理は可能ですが、NPUには以下の明確な優位性があります：

電力効率：同じAI処理をGPUで行う場合と比べ、消費電力を大幅に削減。モバイルデバイスのバッテリー持続時間を向上
専用設計：行列演算や活性化関数など、AI特有の処理に最適化されたハードウェア構造
低遅延：クラウドへのデータ送信不要で、リアルタイム処理が可能

4. 中国NPUチップメーカー5社の詳細分析

中国では、米国による半導体輸出規制を背景に、NPUを含むAI半導体の国産化が急速に進んでいます。ここでは、特にエッジAI分野で注目される5社を詳しく解説します。

4.1 Horizon Robotics（地平線）

概要

Horizon Robotics（地平線機器人） は2015年に元Baiduの自動運転部門責任者である余凱（Yu Kai）氏によって設立された、中国を代表する自動運転向けAIチップ企業です。Intel、BYD、CATL、フォルクスワーゲンなど錚々たる企業から投資を受けています。

主要製品：BPU（Brain Processing Unit）

Horizon Roboticsは独自のAIプロセッサアーキテクチャ「BPU（Brain Processing Unit）」を開発しています。

製品名	NPU性能	特徴
Journey 2	4 TOPS @2W	ADAS向け。2020年量産開始
Journey 3	5 TOPS	第2世代SoC。Li Auto ONEに採用
Journey 5	128 TOPS	Bayesian BPUアーキテクチャ。ISO 26262 ASIL-B認証取得
Journey 6P	560 TOPS	Nash BPUアーキテクチャ。Transformer対応。2025年Q3量産予定
Sunrise 3	5 TOPS	AIoT向け。Cortex-A53搭載

BPUアーキテクチャの進化
├── Gauss (1.0) ─ Journey 1.0
├── Bernoulli (2.0) ─ Journey 2/3, Sunrise 3
├── Bayesian (3.0) ─ Journey 5
└── Nash (4.0) ─ Journey 6シリーズ

採用実績

BYD、長安汽車、SAIC、Li Auto、GAC、Great Wall Motor、フォルクスワーゲン（CARIAD）など多数の自動車メーカーが採用。Journey 6シリーズはBosch、Densoなどの大手Tier1サプライヤーからも受注を獲得しています。

4.2 Axera（爱芯元智）

概要

Axera（爱芯元智） は、AI視覚認識チップと基盤コンピューティングプラットフォームを開発する中国企業です。スマートシティ、スマート教育、スマート製造などの分野向けに高性能・低消費電力のAI SoCを提供しています。

主要製品：AX6シリーズ

Axeraは独自の混合精度NPU「AXNeutron」とAI-ISP「Aixin Smart Eye」を開発しています。

製品名	NPU性能	CPU	特徴
AX620A	3.6 TOPS @INT8 / 14.4 TOPS @INT4	4x Cortex-A7	4K対応AI ISP搭載。セキュリティカメラ向け
AX630C	Neutron 4.0 NPU	2x Cortex-A53	PSA Certified Level 1取得
AX650N	10.8 TOPS @INT8 / 43.2 TOPS @INT4	8x Cortex-A55	8K@30fps対応。Transformer対応
AX650A	18.0 TOPS @INT8 / 72.0 TOPS @INT4	8x Cortex-A55	AX650シリーズ最上位

技術的特徴

# AX650NでのTransformer推論性能例
モデル: SwinT
性能: 361 FPS
精度: 80.45%
電力効率: 199 FPS/W
量子化: PTQ（Post Training Quantization）対応

AX650Nは、ViT/DeiT、Swin/SwinV2、DETR、DINOv2など多数のTransformerモデルをサポートし、エッジデバイスでの高効率な推論を実現しています。

ツールチェーン

Pulsar2：Axera独自開発のニューラルネットワークコンパイラ。変換、量子化、コンパイル、ヘテロジニアス処理を一括で行い、AX6シリーズの性能を最大限に引き出します。

4.3 Rockchip（瑞芯微）

概要

Rockchip（瑞芯微电子） は、中国を代表するAIoT SoCサプライヤーです。業界で最も早くNPUをSoCに統合したメーカーの一つであり、タブレット、スマートTV、IoTシステム、エッジAIアプリケーションなど幅広い分野で採用されています。

主要製品：RKシリーズ

製品名	NPU性能	CPU	特徴
RV1103/RV1106	0.5 TOPS	単コアCortex-A7/RISC-V	超低消費電力。IoTカメラ向け
RK3562	1 TOPS	4x Cortex-A53	エントリーレベルAIoT
RK3566/RK3568	1 TOPS	4x Cortex-A55	タブレット、NAS向け
RK3576	6 TOPS	4x Cortex-A72 + 4x A53	新世代AIプロセッサ。スパース重み対応
RK3588/RK3588S	6 TOPS	4x Cortex-A76 + 4x A55	フラッグシップ。8K対応

RK3588 NPU詳細スペック

RK3588 NPU仕様
├── アーキテクチャ: 3コア NPU（トリプルコア構成）
├── 演算性能: 6 TOPS @INT8
├── サポート精度: INT4, INT8, INT16, FP16
├── 対応フレームワーク: TensorFlow, PyTorch, ONNX, Caffe, Darknet
├── メモリ: SRAM上への重み/特徴マップ配置対応
└── マルチコア: 単一モデルの複数コア同時実行対応

採用ボード例

Radxa ROCK 5B、Orange Pi 5、Khadas Edge2、Firefly ITX-3588Jなど、多数のSBC（シングルボードコンピュータ）で採用されています。

4.4 Sophgo（算能科技）

概要

Sophgo（算能科技、旧SOPHON/Bitmain） は、RISC-VとTPU（Tensor Processing Unit）を組み合わせたユニークなアプローチでAIチップを開発する中国企業です。「クラウド・エッジ・端末」をカバーするフルスタック製品を提供しています。

主要製品

製品名	NPU/TPU性能	アーキテクチャ	特徴
BM1684	17.6 TOPS @INT8	Arm	第3世代TPU。32ch FHDデコード対応
BM1684X	高性能TPU	Arm + TPU-MLIR	次世代深層学習プロセッサ
CV1800B	0.5 TOPS @INT8	RISC-V + Arm	Milk-V Duoに採用
SG2000	0.5 TOPS @INT8	RISC-V + Arm + 8051	4種類のプロセッサアーキテクチャ統合
SG2002	1 TOPS @INT8	RISC-V + Arm + 8051	SG2000の上位版
SG2042	-	64コア RISC-V @2GHz	サーバーグレードRISC-V CPU

SG2000/SG2002の特徴

SG2000/SG2002は非常にユニークなSoCで、4種類のプロセッサアーキテクチャを1チップに統合しています：

SG2000/SG2002 アーキテクチャ
├── RISC-V (T-Head C906)
│   ├── 1GHz コア（Linux用）
│   └── 700MHz コア（RTOS用）
├── Arm Cortex-A53 @1GHz
├── Intel 8051互換 MCU @25-300MHz
└── 自社開発 TPU @0.5-1 TOPS

採用ボード例

SE5/SM5 Mini：BM1684搭載エッジサーバー
Milk-V Duo：CV1800B搭載超小型開発ボード（$9〜）
Milk-V Pioneer：SG2042搭載64コアRISC-Vワークステーション

4.5 Kendryte（勘智）by Canaan

概要

Kendryte（勘智） は、Canaan（嘉楠科技、NASDAQ: CAN）が開発するRISC-VベースのAIoTチップブランドです。2018年に発売されたK210は、世界初のRISC-VベースのエッジAIチップとして話題を呼びました。

主要製品：Kシリーズ

製品名	NPU性能	CPU	特徴
K210	0.5 TOPS	2x RISC-V @400MHz	世界初のRISC-VエッジAIチップ。0.3W低消費電力
K510	3 TOPS	3x RISC-V @800MHz	K210の3倍性能。DSP拡張対応
K230	6 TOPS @INT8	2x RISC-V C908	最新世代。Transformer対応。MicroPython対応

K230の詳細スペック

K230 仕様
├── CPU: 2x RISC-V C908 (1.6GHz + 800MHz)
├── KPU (Knowledge Process Unit)
│   ├── INT8: 6 TOPS
│   └── INT16: 対応
├── DPU: 3D構造光深度計算 @1280×800 30fps
├── VPU: H.264/H.265/JPEG @4K40fps
├── ISP: AI 2D Engine, 2.5D GPU
└── 対応モデル: ResNet50 ≥85fps, MobileNet_v2 ≥670fps, YOLOv5S ≥38fps

効率比較

チップ	効率 (FPS/TOPS)
K210	86
K510	133
K230	341

K230は、MAC利用率の改善により、K210比で約4倍の効率を実現しています。

採用ボード例

CanMV K230：$49.99で購入可能な公式開発ボード
Sipeed Maix シリーズ：K210搭載の各種開発ボード
Grove AI HAT：Raspberry Pi向け拡張ボード

5. 5社の比較まとめ

メーカー	主要市場	NPU名称	最大性能	特徴
Horizon	自動運転	BPU	560 TOPS	自動車メーカーとの深い連携
Axera	セキュリティ/IoT	AXNeutron	72 TOPS	AI-ISP統合。Transformer対応
Rockchip	汎用AIoT	RKNPU	6 TOPS	豊富なエコシステム。SBC市場で人気
Sophgo	エッジ〜クラウド	TPU	17.6 TOPS	RISC-V推進。フルスタック製品
Kendryte	教育/IoT	KPU	6 TOPS	RISC-V先駆者。MicroPython対応

6. なぜ中国にNPU企業が多いのか

6.1 米国による半導体輸出規制

最も重要な要因は、米国による対中半導体輸出規制です。2022年以降、NVIDIAやAMDの高性能AI半導体（H100、A100など）の中国への輸出が禁止・制限されました。これにより、中国企業は海外製の先端AIチップを入手できなくなり、国産化への強いインセンティブが生まれました。

6.2 政府による大規模支援

中国政府は「中国製造2025」政策の下、半導体の国産化を国家戦略として推進しています。

国家集積回路産業投資基金（大基金）：数兆円規模の政府系ファンド
科創板（スター・マーケット）：ハイテク企業向け株式市場
政府調達での国産優先：政府系機関や大手IT企業に国産チップ採用を推奨

6.3 巨大な国内市場

中国は世界最大の半導体消費市場であり、自動運転、スマートシティ、監視システム、金融、医療など、AIを必要とする産業が急成長しています。

7. まとめ

NPU（Neural Processing Unit）は、AI時代を支える次世代プロセッサとして急速に普及しています。

NPU：AI推論処理に特化した低消費電力プロセッサ
NPUボード：エッジAIの中核として、オンデバイスAIを実現
GPU vs NPU：学習はGPU、推論はNPU。相互補完の関係
中国NPU企業：米中対立を背景に急成長。独自のエコシステムを構築中

特に中国の5社（Horizon、Axera、Rockchip、Sophgo、Kendryte）は、それぞれ異なる市場セグメントで強みを持ち、活発な開発を続けています。RISC-Vの採用やTransformerモデルへの対応など、技術的にも興味深い動きが多く、今後の展開が注目されます。

参考リンク

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up