アルゴリズムを簡単に試せる点ではCPU, GPUだ。
しかしそれだけが使える手段というわけではない。
よくよく調べてみると、DNNが実行できる枠組みを提供しているチップが既に存在している。
あなたの実現しようとする内容が、既に回路化されていて、納得のいく条件で入手可能であれば、何も自分たちで自作する必要はない。
Synopsys
解説記事 組み込みビジョンプロセッサの畳み込みCNNエンジンを強化
シノプシスは、同社のエンベデッドビジョンプロセッサ「DesignWare EV6x Vision Processors」に搭載されている畳み込みニューラルネットワーク(CNN)エンジンを強化した。従来製品と比較して性能が4倍向上している。
シノプシスの製品はIPコアのデザインであって、シノプシスから購入する人は、独自のLSIを作成する大手の企業に限られると思われます。
YouTube synopsys DesignWare EV6x Processors Offer 4.5 TeraMACs/sec
YouTube Synopsys DesignWare EV6x Processors for High-Performance Vision Applications
YouTube Synopsys [Synopsys Demonstration of Deep Learning with VGG16 on the DesignWare EV6x Vision Processor]
(https://www.youtube.com/watch?v=loaLbccc6I4)
YouTube Synopsys Embedded Vision YOLO Demo at ARC Processor Summit 2017
Slideshare "Designing Scalable Embedded Vision SoCs from Day 1," a Presentation from Synopsys
Cadence
cadence Convolutional Neural Networks (CNN)
cadence Using Convolutional Neural Networks for Image Recognition
Cadence Algorithm for Traffic Sign Recognition in GTSRB Dataset
Youtube Pedestrian Detection: Cadence Tensilica IVP DSP on Cadence Protium FPGA-based prototyping platform
Youtube CNN German Traffic Sign Recognition Demo using Cadence Tensilica DSP
YouTube Cadence Demonstration of People Detection
Ambarella
ambarella [object detection/classification (CNN)]
(https://www.ambarella.com/technology/technology-overview)
アンバレラは監視カメラ用などの画像用のチップであって、その分野の必要性から、顔検出や人検出の機能を持っています。それがCNNを使うようになっています。
Ambarellaの銘柄分析。暴落した今が仕込み時か?「ポストNVIDIA」として期待。
Ambarella at CES 2018: Announcing CV1 and CV22 SoCs with CVflow CNN engines
Intel Movidius™ Myriad™ 2 VPU
Youtube Vehicle detection using Movidius compute neural stick
qiita Raspberrypi3でMovidius Neural Compute Stickのサンプルまでを動かしてみた
qiita ディープラーニング向けのUSBデバイス「Movidius Neural Compute Stick」を試す
DMP
Deep Learning / AI / ZIA™ / ZIA™ Classifier
2017年11月30日
ディジタルメディアプロフェッショナル、マクニカ アルティマカンパニー、モルフォとインテル® FPGA を使用したAI(人工知能)/ディープラーニング(深層学習)技術で提携
モルフォとデンソー、次世代画像認識システム向けDNNアルゴリズムを開発
DMPは画像関係のチップのメーカーの1つであって、その技術を深層学習の分野に展開しています。
NXP
Squeezenet™ニューラル・ネットワーク、顔認識などのプロジェクトコード / デモコード サンプル
Tools and Enablement: SqueezeNet CNN on S32V234
Pedestrian Detection using S32V234 Vision Processor
Neural Networking (CNN) for Pedestrian Detection using S32V Vision Processor
NXP Demonstration of Real-time CNN Image Classifier and Pedestrian Detection on S32V234 Processor
以下のYouTubeにあるCogniVueは2段階の買収の末,NXPの一部になっているようです。
YouTube CogniVue Corporation
フリースケール、CogniVue Corporationの買収により衝突回避機能を備えた自動運転車のソリューション開発を加速
フリースケール買収のNXP、車載半導体で首位ルネサスに肉薄か――世界半導体シェアは7位へ
Renesas
Renesas Demonstrations of Surround View, Pedestrian Detection and Sign Recognition
Xilinx
YouTube Xilinx Facial Detection Demo
YouTube Xylon Face Detection and Tracking for Xilinx Zynq-7000 AP SoC
YouTube Xilinx Demonstration of Multi-Object Detection
YouTube Pedestrian Detection (PDET)
YouTube Deep learning Object detection (CNN) on FPGA
YouTube Megvii Face++ Intelligent Facial Recognition: Powered by Xilinx
YouTube YOLOの実装 Convolutional Neural Network
HirokiNakahara/GUINNESS
深層学習をベースとした歩行者検出のFPGA実装です。
まず、その動作の状況は次のYouTube動画で確認できます。
YouTube GUINNESS を使った歩行者検出デモ@ET2017
この動作をさせたければ、次のgithubでRequirements: を満たす環境を確保します。XilinxのFPGAボードが必要になります。
HirokiNakahara/GUINNESS
https://github.com/HirokiNakahara/GUINNESS
- Slideshare 2値ディープニューラルネットワークと組込み機器への応用: 開発中のツール紹介
- Slideshare (公開版)Reconf研2017GUINNESS
- AVNET FPGA向け Deep Learning 統合開発環境 GUINNESS
etc
YouTube Optical Flow and Pedestrian Detection with OpenCL
YouTube BrainCard Demo No. 1: Facial Recognition (people/expressions/actions
Altera CNN based pedestrian detection system
BNN on Regulus intelligent camera "Eiger" (Zynq-7020
Zynq UltraScale+ MPSoC 採用 レグラス社インテリジェントカメラ
Hai Tao at AI Frontiers: Deep Learning For Embedded Vision System
HuaweiのAI内蔵CPU「Kirin 970」はスマホの進むべき道を示す重要な製品だ
ファーウェイ、世界初AI対応CPU「Kirin 970」発表 搭載スマホMate 10は10月16日発表予告
ちなみにCPUのAI処理機能は「Kirin AI API」としてサードパーティーも利用可能。またGoogleが開発したTensorFlow/Tensorflow Liteと、Facebookが開発したCaffe/Caffe2といった機械学習のためのオープンソースソフトウェアライブラリにも対応している。
Deep-Learning-Processor-List
画像認識を強化したシステムを作ろうとすると、ただ単にDNNなどのIPがあれば十分というわけではない。
処理しようとする画像のサイズとフレームレートが明確になっていること。
画像認識しやすくするための前処理も必要になる。
画像処理のフレームレートを向上させて、しかも遅延を少なくしようとすれば、USB3.0よりももっとハードウェアに近いレベルで
カメラに接続することだ。
そのようなことを考慮に入れたときには、CPUまわりのバスの設計がそういったことを可能にしているのかを確認しなくてはならない。
github Pedestrian Detection in Videos
Kirin 970は最強じゃないからね。Snapdragon 8xxの方が凄いんだからね!スペック表
コメントの中で次のような記載があります。
最近の中華系企業は、結構後々のアプリケーション開発の汎用性も考えていますから、一頃の日本みたいに専用チップ搭載で、他社より一時的に凄い……1年、2年後に開発サポート打ち切りみたいな真似は極力しないために、ASICを上手に使うことが多いのです。
Ultra96 ボード
Interface 2019年1月号 ボードも開発環境もAI向けに進化しまくり 小型リアルタイム組み込み人工知能
64ビットCortex-A/GPU/FPGAチップ搭載で3万円
組み込み人工知能にピッタリ!最強Arm FPGAボード「Ultra96」
奥畑 宏之
開発環境の準備からLinux&My回路生成まで 最強ArmコアFPGAボードUltra96の基本的な使い方
Xilinx Ultra96, FPGA 96Boards Development Board