ステレオカメラの領域にも深層学習が及んできている。
ヒトは、過去の経験を元に、単眼でも空間的な奥行きはこんなのではなかろうかと推測できる。
それが深層学習で、単眼のカメラからの奥行きの推定に及んできている。
-
SlideShare [Depth estimation using deep learning]
(https://www.slideshare.net/SoubhiHadri/depth-estimation-using-deep-learning) -
qiita [誰でもできる深度推定 ~Depth Map Prediction in TensorFlow from beginning to end~]
(https://qiita.com/MasazI/items/67724fc676040bd490c4) -
qiita [[Survey]Depth Map Prediction from a Single Image using a Multi-Scale Deep Network]
(https://qiita.com/supersaiakujin/items/5fbac19a47a93f89b85c) -
Youtube [Semi-Supervised Deep Learning for Monocular Depth Map Prediction | Spotlight 2-1A]
(https://www.youtube.com/watch?v=KpJRSJx5yKs) -
Youtube [Unsupervised Monocular Depth Estimation With Left-Right Consistency]
(https://www.youtube.com/watch?v=jI1Qf7zMeIs) -
pdf [Real-Time Depth Estimation from 2D]
(http://cs231n.stanford.edu/reports/2016/pdfs/407_Report.pdf) -
Introducing OAK: Spatial AI Powered by OpenCV
以下のHWに対応するライブラリが提供される予定らしい。
追記:奥行きの推定についての仮説
Q:ヒトは密に視差を求めているだろうか?
仮説:ヒトは密に視差を求めてはいない。私はそう考える。
理由:
- 左右のそれぞれの眼球からの画像は、交差して右左のの脳半球に届けられる。
- ステレオカメラの密に視差を求めるためには、密にテンプレートマッチングを必要とする。
- 脳半球を脳梁がつないでいるといっても、密にテンプレートマッチングできるほどの情報を共有させることができるとは、私には思えない。
推定:
視差は求めているが、明瞭な特徴点についてだけしか実施していないのではなかろうか。
それ以外の奥行きの推定は、最近流行りのDNNによる奥行き推定のようなやりかたをしているのではなかろうか。
追記(2023.09.30)
Luxonis OAK-D Depth AIカメラが国内でも購入可能になっている。
[Luxonis OAK-D Depth AIカメラ]
(https://www.switch-science.com/products/7222)
追記(2023年12月)
NVIDIAのデバイスが利用可能ならば
Stereo Depth DNN
の記事を読んでほしい。
この中でNVIDIAのデバイスでのStereo Depth DNNの使い方が書いてある。
追記
以下の場所に最近の実装であるIGEVに対する移植がある。
GitHUb libIGEVStereo
参考情報
次の方が、Stereo Depth関係の記事を大量に書いてくださっている。