KDD2015 Fast and Robust Parallel SGD Matrix Factorizationを読んだ
どんなもの?
高速で堅牢な行列分解手法を提案。
shared memoryの環境だけでなく、block storage環境でも効率よく動く。
先行研究と比べると?
- SGDの並列実行スケジューリングを効率よく行う
- block storage上でSGDのランダム実行を行う
技術や手法のキモはどこ?
- 行列のパーティショニングにMulti-Level Grid Fileを使う
- 非同期のIOを活用することで、IO waitを減らす(SSDなど並列IOにも非同期IOは適している)
どうやって有効だと検証した?
shared memory環境、block storage環境の両方で今までのアルゴリズムより性能が良いことを示した。
議論はある?
- IO性能の違いではあまり性能差が出ない(隠ぺいできた)
- page sizeの違いもあまり性能差に影響しなかった
次に読むべき論文は?
- Document clustering based on non-negative matrix factorization