A Large Dataset to Train Convolutional Networks for Disparity, Optical Flow, and Scene Flow Estimation
DispNetはMC-CNNやSGM(Semi Global Matching)と違う方法でDepthを計算していたので、面白いと思い記事にします。
*optical Flowについても記述があるのですが今回は無視します
新規性
左右の画像を結合して入力
 入力の時点で特徴量6、すなわち右と左のRGBが入力とい事がわかります。 MC-CNNではPatch(9x9のエリアをくり抜いた物)を入力して、CNNで畳込むのですが、すべてのDisparityに対して同じ処理を何回も繰り返さなきゃいけなく、かなり計算コストが重めだった。しかもこっちの方が画像全体を参照出来るから良いんじゃないかと思った。
Correlation Layer
DispNetとDispNetCorr1Dというのが下の結果のTableにあるのですが、Correlationとは取り得るDisparityに対して右と左のFeature MapをシフトしてCost Volumeを作る事を言います。
*Stereo Matchingの取りうるすべてのDisparityに対して特徴を計算するのに似ています