1. 概要
大規模でスパースかつノイズのある点群から3D暗黙の表面を復元するための画期的な手法。
2. 新規性
ニューラルカーネルフィールド(NKF)表現をベースとし、NKFと同様の一般化能力を享受しながら、主な制約条件を同時に解決することができる。大規模なシーンへのスケール、ノイズへの頑健性、密な方向性のある点のデータセットから学習、オブジェクトとシーンのスケールが異なるトレーニングデータを混在させることも可能。
3. 実現方法
入力ポイントとその法線は最初に疎な畳み込みニューラルネットワークに入力される。デコーダーブランチでは、構造予測ブランチが適応的な疎なボクセルグリッドを出力する。この疎なボクセルグリッドには、異なるサイズの階層的なボクセルが含まれている。それぞれのボクセルについて、グリッド内の任意の位置で使用される潜在的な特徴を予測する。次に、勾配ベースのカーネル形式に従って表面フィッティングエラーを最小化するための疎な線形システムを構築し、疎なソルバーを使用して解を得る。得られた係数αと予測されたカーネルフィールドを使用することで、ジオメトリを定義する隠れた関数を評価することができる。
4. 結果
ShapeNet、ABCなどの単一オブジェクト(再構築ベンチマーク)、ScanNet、Matterport3Dなどの屋内シーン、CARLA、Waymoなどの屋外シーンでも最先端の結果を達成している。