More than 5 years have passed since last update.

DEEP PROBABILISTIC PROGRAMMING ---”深層学習＋ベイズ”のライブラリ--- Edwardの紹介

Last updated at 2017-04-17Posted at 2017-04-17

WHY

Edward

実装面と今後の伸びしろに期待を込めて下記の観点から紹介します。

Google Researchの人が共著者
BackEndがTensorflow
CaffeeのModel Zooのようなものがあり公開済みモデル用のエコシステムがある
深層学習よりも収束が早く次のトレンドになりそう

Deep Probabilistic Programmingを読んだのでこの内容から抜粋して紹介します。

どんなもの?

従来の深層学習よりも柔軟性があり、かつ計算効率の良い確率的プログラミングが可能なライブラリの紹介。
同じモデルを別の推論機で使用できる。
推論の一部としてモデルの表現の再利用が可能なのでバラエティに富んだネットワーク構成も可能
バックエンドがTensorflowでできておりCaffeeのModel Zoo のようなものがあるProbability Zoo

先行研究と比べてどこがすごい?

・計算効率が深層学習よりも良い
・柔軟性のある推論部分の作成
・Stan,PyMC3に比べてロジスティック回帰で35倍の速度

技術や手法のキモはどこ?

・ランダムな値生成と推論で構成
・オープンな技術で作成（バックエンドがTensorflow）
・推論部分にモデルの構築も含めている部分が従来のものと異なる。
・Bayesian Recurrent Neural Network with Variable Length

具体例

Bayesian Recurrent Neural Network with Variable Length

Normal:正規分布

Weightと正則化の正規分布の平均と分散を学習

GAN

生成用のネットワークと識別用のネットワークを構成し、データのパラメータは分布から生成。予測値も分布から生成

推測器の複合

EM Algorithm

どうやって有効だと検証した?

各手法の比較検討

従来ライブラリとの比較

PyMCとStanで速度検証

Stanの約20倍
PyMCの約40倍

Spec
12-core Intel i7-5930K CPU 3.5GHz NVIDIA Titan X(Maxwell) GPU

Task
generate posterior samples with Hamiltonian Monte Carlo

Data
Covertype dataset (N = 581012, D = 54; responses were binarized)

Other
100 HMC iterations, with 10 leapfrog updates per iteration and a step size of 0.5/N

35x speedup from stan

議論はある?

最新の技術は伝統的なベイズ手法をもっと取り入れていきたい
巨大なデータにおいても適用できるようにしていきたい

次に読むべき論文は?

本格的な使用方法がわかるので下記の論文がオススメ
Tran, Dustin, et al. "Edward: A library for probabilistic modeling, inference, and criticism." arXiv preprint arXiv:1610.09787 (2016).

Reference

Deep Probabilistic Programming

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up