KDD2015 Large-Scale Distributed Bayesian Matrix Factorization using Stochastic Gradient MCMCを読んだ
どんなもの?
ベイズ行列分解はその有効性にも関わらず、計算コストがネックになりあまり使われていない。
ギブスサンプリングを使った場合と同程度の精度を高速に出せる手法を提案する。
先行研究と比べると?
stochastic gradient langevin dynamics(SGLD)を分散環境で使えるようにした
技術や手法のキモはどこ?
SGDをDSGDにしたときの考え方をSGLDに適用した?
どうやって有効だと検証した?
netflixとyahooのデータセットで精度と速度を比較した。
比較対象はSGD,DSGD,SGLD,DSGLD,gibbs sampler
議論はある?
次に読むべき論文は?
- Bayesian probabilistic matrix factorization using markov chain monte carlo
- Largescale matrix factorization with distributed stochastic gradient descent
- Bayesian learning via stochastic gradient langevin dynamics