Stereo Matching by Training a Convolutional Neural Network to Compare Image Patches
SGM(Semi Global Matching)やBM(Block Matching)などの人間によってチューニングをしたパラメーターをCNNにやらせようというかなり初期に提案された方法を見ていきたいと思う。
新規性
SGMをbaseにしてMatching Costの計算の方法をCNNで行うという手法である。 どうやってMatching Costを求めるか見ていきたいと思うThe fast architecture
 1つ目は計算速度の早いネットワークで、Left input patchとRight input patchを入力にCNNで特徴量を畳み込み、内積(Dot Product)の計算をしてSimilarity Score(Matching Score)を出力。 右と左の特徴が似ていればSimilarity Scoreは高くなる。The accurate architecture
 2つ目はより精度に重点を置いたネットワークで、内積をとるのではなくChannel方向に結合(Concatenate)しFully Connectedを行い最後にsigmoidをする事で0~1にsimilarity scoreを正規化出来る。単純に内積を出すのではなく特徴を結合する事で、精度があがる.
「なんでやねん!」って思う人がいると思うので、あえて言うなら特徴量1つ1つに重みをつけたりMatchingする特徴の組み合わせによってsimilarity scoreを変化する事が出来るイメージ
結論
・CNNを用いてMatching Costを計算する事が出来る ・Concatした方が精度が良いこの手法をPatch(くり抜いた画像の一部)にやるのではなくて、画像全体にやる手法に関して次は見ていきたい!