StereoNet: Guided Hierarchical Refinement for Real-Time Edge-Aware Depth Prediction
stereo depthが遅いので早いネットワークを作ろう!って事でStereoNetが提案された。
お〜早いのか。どうやって早くしたんじゃ?
ちなみにGC-Net likeな構成になってる。
新規性
Hierarchical Refinement: Edge-Aware Upsampling
 低解像度で求めたDisparityを入力画像サイズまでBiliner interpolationしてupsampleする。このネットワークの入力はUpsampleしたDisparity Mapと入力画像である。そうする事で、物体の境界線などを参照する事が出来、鞣しみたいな効果が得られる。
そもそも最初のDisparityが間違っていればそれを参考に鞣すだけなので精度はあがらない。
結果
 0.015sって早っ!結論
・Refinementを使うことで低解像度(1/4)画像サイズでもそこそこの精度と同時に計算コストを大幅に下げられる。 さすがGoogleさn!RefinementするならReconstruction Errorを使った方が良いと思うのだが。