On the Importance of Stereo for Accurate Depth Estimation:An Efficient Semi-Supervised Deep Neural Network Approach
NVIDIAさんのリサーチでstereo depth estimationとmono depth estimationのどっちの方が精度が良いのか調べたら、stereoの方が良かったのでmonoは諦めて、stereoのalgorithmの紹介をしますという論文だった。
今回の寄与は
・Unspervised => Unspervised(Image)+Supervised(LiDAR)
特に新しい事では無いが、LiDARとImageの両方をLossに使えば精度が上がる。
・ReLU+Bachnorm => ELU
BatchNormをなくす事でネットワークが早く学習出来るようになったらしい。
*詳細はELUの論文に記載があった。
・soft-agmax => machine-learned-argmax
意思決定を行う前に、ネットワークがコンテキストをより適切に組み込むことができる