Cascade Residual Learning: A Two-stage Convolutional Neural Network for Stereo Matching
Stereo Matchingでもtwo-stage Networkの方がone-stageより精度が高い!
DipFullNet
 DispFullNetは[FlowNetC](https://arxiv.org/pdf/1612.01925.pdf)をHalf ResolutionではなくFull Resolution(入力と同じ解像度)でoutputするように改良したモデル。 入力はLeft ImageとRight Imageで出力がFull ResolutionのDisparity Mapとなる。DispResNet
 IR(右の画像)とd1を使いIL'(左の推定した画像)を作る。 IL(左の画像)とIL'を使いeL(推定のエラー)を計算する。 それらをDispReNetに入力し、d1をdownsampleしたものとr2(s)を足し合わせる事でd2(s)を推定する。これをFull Resolutionまで計算し、最終結果d2(0)を出力する。