PIXOR: Real-time 3D Object Detection from Point Clouds

アルゴリズム
入力

2DのGridに区切り、(H/dH+3)のChannelを持つ
H/dHは、dHの間隔で高さ方向に区切られた領域に点が存在するか(occupancy)
3は、高さを3つに区切った、領域のintencity*
*たぶん。。。
ネットワーク

ただたんに2DのObject DetectionをBEVで行うだけ。
LocalとGlobalの情報得るために、FPN(Feature Pyramid Network)を使うと良いらしい。
出力

高さ方向の情報は使わないから、zcとhは出力しないらしい。
結果

・2Dだけに、なかなか早くなってる
結論
・かなりシンプルだし入力を変えたり、ネットワークを深くしたりと色々工夫すればもう少し精度あがりそう。
参考文献
PIXOR: Real-time 3D Object Detection from Point Clouds
https://arxiv.org/pdf/1902.06326.pdf