GPU
機械学習
FPGA
DNN
深層学習

DNNを実行できるIPがついたCPUが登場している

アルゴリズムを簡単に試せる点ではCPU, GPUだ。
しかしそれだけが使える手段というわけではない。

よくよく調べてみると、DNNが実行できる枠組みを提供しているチップが既に存在している。
あなたの実現しようとする内容が、既に回路化されていて、納得のいく条件で入手可能であれば、何も自分たちで自作する必要はない。

Synopsys

解説記事 組み込みビジョンプロセッサの畳み込みCNNエンジンを強化

シノプシスは、同社のエンベデッドビジョンプロセッサ「DesignWare EV6x Vision Processors」に搭載されている畳み込みニューラルネットワーク(CNN)エンジンを強化した。従来製品と比較して性能が4倍向上している。

 
シノプシスの製品はIPコアのデザインであって、シノプシスから購入する人は、独自のLSIを作成する大手の企業に限られると思われます。

YouTube synopsys DesignWare EV6x Processors Offer 4.5 TeraMACs/sec

YouTube Synopsys DesignWare EV6x Processors for High-Performance Vision Applications

YouTube Synopsys Synopsys Demonstration of Deep Learning with VGG16 on the DesignWare EV6x Vision Processor

YouTube Synopsys Embedded Vision YOLO Demo at ARC Processor Summit 2017

Slideshare "Designing Scalable Embedded Vision SoCs from Day 1," a Presentation from Synopsys

Cadence

cadence Convolutional Neural Networks (CNN)

cadence Using Convolutional Neural Networks for Image Recognition
Cadence Algorithm for Traffic Sign Recognition in GTSRB Dataset

Youtube Pedestrian Detection: Cadence Tensilica IVP DSP on Cadence Protium FPGA-based prototyping platform

Youtube CNN German Traffic Sign Recognition Demo using Cadence Tensilica DSP

YouTube Cadence Demonstration of People Detection

Ambarella

ambarella object detection/classification (CNN)

アンバレラは監視カメラ用などの画像用のチップであって、その分野の必要性から、顔検出や人検出の機能を持っています。それがCNNを使うようになっています。

Ambarellaの銘柄分析。暴落した今が仕込み時か?「ポストNVIDIA」として期待。

Ambarella at CES 2018: Announcing CV1 and CV22 SoCs with CVflow CNN engines

Intel Movidius™ Myriad™ 2 VPU

https://www.movidius.com/solutions/vision-processing-unit

Neural Compute Stickを試してみよう

Youtube Vehicle detection using Movidius compute neural stick

qiita Raspberrypi3でMovidius Neural Compute Stickのサンプルまでを動かしてみた

qiita ディープラーニング向けのUSBデバイス「Movidius Neural Compute Stick」を試す

DMP

Deep Learning / AI / ZIA™ / ZIA™ Classifier
2017年11月30日
ディジタルメディアプロフェッショナル、マクニカ アルティマカンパニー、モルフォとインテル® FPGA を使用したAI(人工知能)/ディープラーニング(深層学習)技術で提携

モルフォとデンソー、次世代画像認識システム向けDNNアルゴリズムを開発

DMPは画像関係のチップのメーカーの1つであって、その技術を深層学習の分野に展開しています。

NXP

S32V234: Vision Processor for Front and Surround View Camera, Machine Learning and Sensor Fusion Applications

Squeezenet™ニューラル・ネットワーク、顔認識などのプロジェクトコード / デモコード サンプル
Tools and Enablement: SqueezeNet CNN on S32V234

Pedestrian Detection using S32V234 Vision Processor

Neural Networking (CNN) for Pedestrian Detection using S32V Vision Processor

NXP Demonstration of Real-time CNN Image Classifier and Pedestrian Detection on S32V234 Processor

以下のYouTubeにあるCogniVueは2段階の買収の末,NXPの一部になっているようです。
YouTube CogniVue Corporation

フリースケール、CogniVue Corporationの買収により衝突回避機能を備えた自動運転車のソリューション開発を加速

フリースケール買収のNXP、車載半導体で首位ルネサスに肉薄か――世界半導体シェアは7位へ

Renesas

Renesas Demonstrations of Surround View, Pedestrian Detection and Sign Recognition

Xilinx

YouTube Xilinx Facial Detection Demo

YouTube Xylon Face Detection and Tracking for Xilinx Zynq-7000 AP SoC

YouTube Xilinx Demonstration of Multi-Object Detection

YouTube Pedestrian Detection (PDET)

YouTube Deep learning Object detection (CNN) on FPGA

YouTube Megvii Face++ Intelligent Facial Recognition: Powered by Xilinx

YouTube YOLOの実装 Convolutional Neural Network

HirokiNakahara/GUINNESS

深層学習をベースとした歩行者検出のFPGA実装です。
まず、その動作の状況は次のYouTube動画で確認できます。
YouTube GUINNESS を使った歩行者検出デモ@ET2017
この動作をさせたければ、次のgithubでRequirements: を満たす環境を確保します。XilinxのFPGAボードが必要になります。

HirokiNakahara/GUINNESS
https://github.com/HirokiNakahara/GUINNESS

etc

YouTube Optical Flow and Pedestrian Detection with OpenCL

http://www.general-vision.com/hardware/braincard/

YouTube BrainCard Demo No. 1: Facial Recognition (people/expressions/actions

Altera CNN based pedestrian detection system

BNN on Regulus intelligent camera "Eiger" (Zynq-7020

Zynq UltraScale+ MPSoC 採用 レグラス社インテリジェントカメラ

Hai Tao at AI Frontiers: Deep Learning For Embedded Vision System

HuaweiのAI内蔵CPU「Kirin 970」はスマホの進むべき道を示す重要な製品だ

ファーウェイ、世界初AI対応CPU「Kirin 970」発表 搭載スマホMate 10は10月16日発表予告

ちなみにCPUのAI処理機能は「Kirin AI API」としてサードパーティーも利用可能。またGoogleが開発したTensorFlow/Tensorflow Liteと、Facebookが開発したCaffe/Caffe2といった機械学習のためのオープンソースソフトウェアライブラリにも対応している。

HiSilicon Technologies Shares Best Practices to Accelerate the Achievement of Maximum Megahertz per Milliwatt on their Kirin 970 Arm® Core-Based Mobile AI Computing SoC Using the Synopsys Design Platform

Deep-Learning-Processor-List

https://github.com/basicmi/Deep-Learning-Processor-List


画像認識を強化したシステムを作ろうとすると、ただ単にDNNなどのIPがあれば十分というわけではない。
処理しようとする画像のサイズとフレームレートが明確になっていること。
画像認識しやすくするための前処理も必要になる。
画像処理のフレームレートを向上させて、しかも遅延を少なくしようとすれば、USB3.0よりももっとハードウェアに近いレベルで
カメラに接続することだ。

そのようなことを考慮に入れたときには、CPUまわりのバスの設計がそういったことを可能にしているのかを確認しなくてはならない。

Vision HDL Toolbox

github Pedestrian Detection in Videos

Interface2018年2月号 目次

Kirin 970は最強じゃないからね。Snapdragon 8xxの方が凄いんだからね!スペック表

コメントの中で次のような記載があります。

最近の中華系企業は、結構後々のアプリケーション開発の汎用性も考えていますから、一頃の日本みたいに専用チップ搭載で、他社より一時的に凄い……1年、2年後に開発サポート打ち切りみたいな真似は極力しないために、ASICを上手に使うことが多いのです。


画像認識技術の評価時の留意点