背景
Stereo Depthで4D Cost Volume(Disparity,Channel,Height,Width)を作る手法が主流となっているがそれだと遅いんじゃないと思い今回自分で考えたネットワークを学習させてみた。
シンプルに右と左の特徴量をConcatenateしてUnetでDisparityを求めるだけのシンプルなネットワークになっている。
結果
KITTI Datasetを100 epoch Self-SuperviseでTrainingした。Batchはメモリーの都合上1に設定。
run time = 20.9271907806[ms]
input left

input right

disp left

disp right

Reconstruct Left

Reconstruct right

結論
・あんまり結果が良くないですね
まだまだ改善の余地ありそうです