概要
先月京都で開催されていたIROS2022に参加してきたので、どのような研究が行われているのか簡単にまとめてみる。
まとめは以下の形で行う。
- 論文
- 公開された論文があればリンクを添付
- 課題
- 提案手法
- 新規性
- 効果
- 一部気になった論文のみ記載
- コード
- 公開されたコードやその他データがあればリンクを添付
まず一番興味があったSLAM全8セッションについてまとめる。
SLAM 1
Making Parameterization and Constrains of Object Landmark Globally Consistent via SPD(3) Manifold and Improved Cost Functions
- 論文
- 課題
- 疎な点、線、または平面に基づく従来のSLAMと比較して、オブジェクトレベルSLAMは、セマンティックラベルが埋め込まれた、より高レベルでよりコンパクトなランドマークを含むマップを提供する。
- このような人間のような環境認識は、変化する照明や視点の下でのロバスト性を向上させるだけでなく、ロボットが屋内でオブジェクトの隣に移動してオブジェクトを取り出したり、車を認識して屋外の特定の障壁を回避したりするなど、より複雑なアクションを実行できるようにする。
- オブジェクトレベルのSLAMのバックエンドは、既存の方法がオブジェクトランドマークをスケールとポーズによって別々にパラメータ化するため、特異点の問題に悩まされる。
- 提案手法
- オブジェクトレベルSLAMのバックエンド最適化プロセスにSPD多様体を導入
- 新規性
- SPD多様体上で最適化する方法と、それを最適化ベースの物体SLAMシステムに統合する方法を提示する。
- 物体レベルのランドマークに対してよく使われるいくつかの制約関数を改良し、楕円体の2つの観測モデルを比較する。
- 以上2点を組み込んだ単眼カメラによる物体SLAMシステムの改良型バックエンドを提案する。
- コード
- なし
ULSM: Underground Localization and Semantic Mapping with Salient Region Loop Closure under Perceptually-Degraded Environment
- 論文
- 公開なし
- 課題
- 地下鉱山における自律走行システムの構築は、高精度なリアルタイム定位と厳しい安全要件が要求されるため、非常に困難である。
- 近年、SLAMは進化していますが、地下や鉱山のトンネル内で高品質の地図を構築することは、依然として大きな課題となっています。
- 課題1
- ほとんどのLIDAR SLAMシステムは、異なるセンシングモダリティの潜在的な障害を無視しており、これはオドメトリの性能劣化につながる。
- 課題2
- 地下トンネルの類似した外観の通路で発生しやすいスプリアスループクロージャーは、マッピングに深刻な歪みをもたらす可能性があります。
- 提案手法
- ULSM(Underground Localization and Semantic Mapping)
- 知覚劣化環境下における顕著領域ループクロージャーを用いた地下定位とセマンティックマッピング
- ULSM(Underground Localization and Semantic Mapping)
- 新規性
- センサーの故障に対処するために、マルチソースのオドメトリに依存する2段階のロバストな動き補償方法を提示する。
- 類似した外観の環境において良好に動作する、深層学習ベースの顕著な領域ループ閉鎖アプローチを提案する。
- 抽出された顕著領域記述子と開発されたデータベースアプリケーションシステムに基づいて、マルチロボット協調マッピングスキームを設計し、大規模マッピングの効率を向上させる。
- コード
- 公開なし
NDD: A 3D Point Cloud Descriptor Based on Normal Distribution for Loop Closure Detection
- 論文
- 課題
- SLAM(Simultaneous Localization and Mapping)は、ここ数十年で急速に発展してきたロボット工学の基本技術の一つである。
- 視覚的なSLAMと比較して、LiDAR SLAMは照明の変化に強いため、位置特定タスクに広く使用されています。
- 一般的に点群を表現する記述子には,Bag-of-words, 手作りのグローバル記述子,ディープラーニングに基づくグローバル記述子の3種類が存在する.
- 近年,学習によって点群を記述する手法が注目されている.
- 学習ベースの記述子は,精度において高い性能を示すが,GPUによる高い計算コストとメモリを必要とする。
- また,これらの手法は,汎化性が低いため,未知の環境に適用することが困難である。
- 提案手法
- 新しいループクロージャ検出のための3次元点群記述子NDD(Normal Distribution Descriptor)
- 新規性
- 点群を表現する特徴量として、正規分布に基づく2スケール統計量を用いる。
- コサイン距離を相関係数に置き換え,類似性マッチングのための2つの記述子間の高速なアライメント方法を提案する.
- 効果
- KITTI, Mulran, NCLTデータセットを使用
- 比較対象:Scan Context(SC), Intensity Scan Context (ISC), LiDAR Iris, M2DP
- 記述子の性能
- 提案手法(NDD)は特に、逆ループ検出において他記述子を大きく上回る。
- 全体的な処理コスト
- 提案手法(NDD)は比較対象の中ではISCと同程度の時間を要するが、精度の面で大きく上回る。
- KITTI, Mulran, NCLTデータセットを使用
- コード
- なし
FEJ-VIRO: A Consistent First-Estimate Jacobian Visual-Inertial-Ranging Odometry
- 論文
- 課題
- 近年、視覚・慣性オドメトリ(Visual-Inertial Odometry: VIO)は大きな発展を遂げている。
- しかし、VIOの手法は、長い軌跡での定位ドリフトに悩まされている。
- 正確な自己位置推定を行うためにはGPS、モーションキャプチャ(mocap)や人工視覚マーカ(AprilTagsなど)からの外部位置推定情報を融合することが代替ソリューションとなります。
- しかしGPSは開けた場所でしか使えないし、mocapは屋内の固定された環境で高価で複雑なセットアップが必要で、どちらも密集した都市部には展開できない。
- また、人工的なビジュアルマーカーの使用は柔軟性に欠け、広範囲をカバーするためにマーカーを配置することが困難です。
- 提案手法
- FEJ-VIRO(First-Estimates Jacobian Visual-Inertial- Ranging Odometry)
- 超広帯域(UWB)測距をVIOのフレームワークに一貫して組み込むんだ手法
- FEJ-VIRO(First-Estimates Jacobian Visual-Inertial- Ranging Odometry)
- 新規性
- 軽量なMSCKFベースの視覚慣性距離オドメトリ(VIRO)法を提案し、UWBアンカーと状態補強のための長短スライディングウィンドウ戦略を提示する。
- また、視覚慣性航法オドメトリの観測可能性解析を行い、理想的なケースにおけるVIROの4つの観測不可能な方向を指摘する。
- FEJ-VIROフレームワークを提案し、FEJ技術を拡張して整合性を維持し、推定精度を明らかに向上させる。
- 効果
- VIRALデータセットで評価
- 比較対象:OpenVINS、VINS-Fusion、VIRO、FEJ-VIRO(提案手法)
- Average ATEは比較対象の中で最も精度が良い。
- 推定軌跡はVINS-Fusionとほぼ同じ精度。
- VIRALデータセットで評価
- コード
- なし
RGB-D SLAM in Indoor Planar Environments with Multiple Large Dynamic Objects
-
論文
-
課題
- 一般的なSLAM手法は環境が静的であることを前提としており、ロボットが他の人間やロボットと協調して作業したり、半自動倉庫で物体を操作したりする場合には、この前提が崩れてしまいます。
- これまでのダイナミックSLAM手法は、セマンティックセグメンテーションに依存して動的オブジェクトを直接検出するか、動的オブジェクトが静的背景よりもカメラビューに占める割合が小さく、したがって外れ値として除去できると仮定している。
-
提案手法
- 複数の大型ダイナミックオブジェクトが存在する屋内平面環境におけるRGB-D SLAM
-
新規性
- 室内の動的環境における平面に基づくオンライン多動作セグメンテーションのための新しい方法論
- 複数の平面剛体オブジェクトの追跡、カメラの自走推定、静的背景の再構成を同時に行う新しいパイプライン
- 複数の大型動的オブジェクトによるカメラ視野の大きなオクルードに頑健なRGB-D SLAM手法
-
効果
- データセット:独自に収集したRGB-D画像。
- 比較対象:PlanarSLAM (PS), EM-Fusion (EMF), Joint- VO-SF (JF), StaticFusion (SF), Co-Fusion (CF), RigidFusion (RF)
- Camera localisation
- 平面的な動的環境において、提案手法が比較対象を凌駕
- 非平面的な動的環境において、EMFは他の全ての手法より優れた性能を発揮することができる。
- しかし、意味的なセグメンテーションに頼らずとも、提案手法はStaticFusionと比較して近い性能を持っている。
- マッピング
- 提案手法のみ、全ての動的物体を除去し背景を正しく復元することができる。
- Multimotion segmentation
- 平面環境
- CFと提案手法、異なる動的オブジェクトをさらに区別することができる。
- しかし、CFのセグメンテーションは完全ではなく、CFは新しいオブジェクトを検出する際に遅延が発生する傾向がある。
- 非平面環境
- 提案手法手法は静的オブジェクトと動的オブジェクトの正しい2値セグメンテーションを提供することができる
- しかし、異なる非平面的な動的物体を独立してセグメント化し追跡することはできない。
- 平面環境
- オブジェクトトラッキング
- 提案手法はCFと比較して、より正確で完全な物体軌跡を得ることができるが、物体の移動が停止したり、他の物体に遮られたりすると、動的物体を追跡できなくなる
-
コード
- なし
DRG-SLAM: A Semantic RGB-D SLAM using Geometric Features for Indoor Dynamic Scene
- 論文
- 公開なし
- 課題
- 点特徴に基づくVisual SLAM手法は、テクスチャの豊富な静止シーンでは許容できる結果を得ているが、実際の室内シーンではテクスチャの欠落や動的物体の存在に悩まされることが多く、その応用は限定的である。
- 提案手法
- DRG-SLAM
- 新規性
- 屋内の動的環境において、ロバストかつ低ドリフトのセマンティックRGB-D SLAMシステム(DRG-SLAM)を提案
- セマンティックセグメンテーションとエピポーラ制約を組み合わせた動的特徴カリング手法を提供し、予め定義された動的オブジェクト上の特徴を除去し、未定義動的オブジェクト上の動的特徴をマルチビュー制約によってカリングする。
- テクスチャのない動的な環境におけるSLAMのロバスト性を向上させるために、線と面の特徴を補完的に追加し、これらの幾何学的特徴を含む静的マップを構築する。
- コード
- 公開なし
Scale-aware direct monocular odometry
- 論文
- 課題
- 機械学習のSLAM(Simultaneous Localization and Mapping)問題への応用はコミュニティによって研究され続けている。
- その中で単眼深度推定に関して畳み込みニューラルネットワーク(CNN)を利用することが提案されており、学習領域に近い画像に対してピクセル単位の奥行きを正確に推定することができる。
- しかし、従来手法は奥行き情報が部分的にしか利用されない。
- 提案手法
- ディープニューラルネットワークからの奥行き予測に基づく、スケールアウェアな直接単眼オドメトリのための汎用フレームワーク
- 新規性
- 測光と深度予測測定のための新しい緊密に結合した最適化
- 深度予測残差にTLS(Truncated Least Square)コストを利用したロバストな最適化
- コード
- 公開なし
IMU preintegration for 2D SLAM problems using Lie Groups
- 論文
- 公開なし
- 課題
- 2次元SLAMは、倉庫など2次元平面に制約のある移動ロボットに有効で、3次元の場合に関して計算を簡略化することができます。
- このような状況でIMUを使用することで、推定をより豊かにし、よりロバストにすることができます。
- IMUは他の多くのセンサよりも高い周波数で動作するため、IMUの事前統合の必要性が生じます。
- 3DにおけるIMUの事前積分の問題はLie理論を用いてよく研究されていますが、我々の知る限り2Dの場合については開発されていない。
- 提案手法
- 2次元IMUデータ(平面内の加速度およびヨーレート)をキーフレームに基づくSLAMに組み込むための事前統合スキーム
- 新規性
- 2次元の平行移動、速度、回転、および時間を含む行列Lie群を提案
- コード
- 公開なし
Scale Estimation with Dual Quadrics for Monocular Object SLAM
- 論文
- 課題
- 近年、畳み込みニューラルネットワーク(CNN)の飛躍的な発展により、オブジェクトレベルSLAMが大きな進歩を遂げている。
- 単眼オブジェクトSLAMが提案されているが、再構成された地図と物理世界との間の絶対的なスケールが未知のままである。
- これはスケールアンビギュイティ問題と呼ばれ、実際のシナリオにこれらのアルゴリズムを適用する際の大きな障害となっています
- 提案手法
- 3次元物体表現として二重二次曲面を用いた単眼オブジェクトSLAMシステム
- 新規性
- 二重二次曲面と物体サイズ事前分布を利用した正確でロバストなスケール推定法
- セマンティックマッピングモジュールを備えた単眼オブジェクトSLAMシステムであり、正確かつタイムリーに物体指向マップを構築できる。
- コード
- なし
SLAM 2
DH-LC: Hierarchical Matching and Hybrid Bundle Adjustment Towards Accurate and Robust Loop Closure
- 論文
- なし
- 課題
- Visual SLAMはカメラのキャリブレーション誤差や特徴量のマッチング誤差などにより、マッピングと定位に累積的なドリフトが発生することが避けられない。
- 多くのSLAMシステムでは、ループクロージャー(LC)モジュールが、グローバルマップから現在のフレームを識別し、ドリフトフリー定位のために累積ドリフトを低減するためにグローバルマップを最適化します。
- しかし既存のLC法には、以下のような課題がある。
- 相対姿勢推定ステップにおいて、特徴量照合は知覚範囲が限定された小さなパッチ内の局所特徴量を用いるため、カメラの視点変化が大きい場合には信頼性が低くなる可能性がある。
- 全体最適化ステップでは、最適化手法の違いにより、シナリオに応じた欠点があります。
- 提案手法
- DH-LC
- 階層的空間特徴量マッチング(HSFM)とハイブリッドBA(HBA)による新しい高精度かつロバストなLC法
- DH-LC
- 新規性
- 提案するHSFM法は、問い合わせ画像と検索画像の間の信頼性の高い相対姿勢を粗視化で推定することができ、大きな視点変更に耐えることができる。
- 提案するHBA法は、蓄積されたドリフトと時間的な相対姿勢の検証に応じて、異なるBA法のアドバンテージを適応的に利用し、グローバルマップを効率的に最適化することが可能である。
- コード
- 公開なし
One RING to Rule Them All: Radon Sinogram for Place Recognition, Orientation and Translation Estimation
- 論文
- 課題
- LiDARを用いたグローバルローカライゼーションは、移動ロボットの基本的な問題である。
- この問題は、場所認識と姿勢推定という2つの段階からなり、現在のスキャンをクエリーとして用い、地図スキャンのデータベースを用いて、現在の方位と並進を得るものである。
- 従来の研究では高解像度のマップから現在の方位と並進を求める手法や、Scan Contextのような理論的に方位の次元を削除し疎なマップからの方位と並進を求める手法がある。
- 提案手法
- ラドンシノグラムを用いた場所認識と方位・移動推定
- 新規性
- すべてのサブタスクに統一的な表現であるラドンサイノグラム(RING)を利用する、疎な場所に基づくグローバルローカライゼーションのための新しいフレームワーク
- ロバスト性とグローバルな収束性を達成するための、方向と並進の不変性に関する理論的な導出
- コード
- 公開なし
Keyframe Selection with Information Occupancy Grid Model for Long-term Data Association
- 論文
- 公開なし
- 課題
- Visual Simultaneous Localization And Mapping (VSLAM)の基本として、キーフレームは重要な役割を担っている。
- これまでの研究では、キーフレームは、短期データ関連付け(STDA)のための一連のビュー変化に基づく戦略に従って選択される。
- しかし、フレームのテクスチャリッチメントは常に無視され、結果として長期的なデータ関連付け(LTDA)に失敗している。
- 提案手法
- 長期データ関連付けのための情報占有率グリッドモデルを用いたキーフレーム選択
- 新規性
- テクスチャに富むキーフレームを選択することで長期的なデータの関連付けを強化することを提案する
- テクスチャの充実度を測るために、情報占有グリッドモデルと統計的に説明できる深い記述子を導入する
- 繰り返し観測とループクロージャーがある状況で、提案戦略が高度な精度を示す
- コード
- 公開なし
PLC-LiSLAM: LiDAR SLAM with Planes, Lines, and Cylinders
- 論文
- 課題
- LiDARを用いたSLAM(Simultaneous Localization and Mapping)は、ロボット工学の分野では基本的な問題である。
- 私たちの先行研究では、LiDAR SLAMのための平面を探索し、視覚SLAMにおけるバンドル調整(BA)と対応する、ドリフトを修正する平面調整(PA)を導入しました。
- しかし平面のみを考慮するため、姿勢推定に十分な平面がない場合これらの方法は失敗する。
- 提案手法
- PLC-LiSLAM(Plane-Line-Cylinder LiDAR-SLAM)
- 平面、直線、円柱を用いたLiDAR SLAM
- PLC-LiSLAM(Plane-Line-Cylinder LiDAR-SLAM)
- 新規性
- 前処理により、局所的および大域的なPLCAの反復最小化が、平面、直線、円筒から取り込まれる点の数に依存しないことを証明する。
- PLCRのための効率的な解法を提示する
- バックエンドでコストを確認することにより、検出誤差を修正する
- コード
- 公開なし
Thermal-Inertial SLAM for the Environments with Challenging Illumination
- 論文
- 課題
- 近年、長波長赤外線(LWIR)カメラは、熱画像から可視域を超える情報を得ることができ、環境照明の影響を受けないため、視覚同時定位・マッピング(SLAM)研究において重要視されています。
- しかし、モダリティの違いにより、可視カメラ用に設計されたSLAM手法を熱データに直接適用することはできません。
- 提案手法
- 照度が厳しい環境下での熱慣性SLAM
- 新規性
- 特徴検出のための新規画像処理アルゴリズムと特徴関連付けのための軽量オプティカルフローネットワークを用いた実用的な熱慣性SLAMシステムを提案する。
- SVDを用いた画像処理手法を提案し、特異値再配置により低コントラストの熱画像でも画質を向上させ、SLAMに利用できるようにした。
- 軽量でリアルタイムなオプティカルフローネットワークアーキテクチャであるThermalRAFTを提案する
- コード
- 公開なし
Are We Ready for Robust and Resilient SLAM? A Framework For Quantitative Characterization of SLAM Datasets
- 論文
- 課題
- SLAMシステムの信頼性は、現代の自律システムにおける重要な要件のひとつと考えられています。
- そのため、多くの最先端システムの開発、困難なデータセットの作成、SLAM性能を測定するための厳密なメトリクスの導入に向けた取り組みが行われています。
- しかし、頑健性/復元性の文脈におけるデータセットと性能の関連性は、これまでほとんど検討されてこなかった。
- 提案手法
- SLAMデータセットの定量的特性評価のためのフレームワーク
- 新規性
- データセットのロバスト性の測定とレジリエンス性の評価手順を提供する
- コード
- 公開なし
Robust Change Detection Based on Neural Descriptor Fields
- 論文
- 課題
- 長時間稼働するロボットにとって、環境の変化を推論する能力は非常に重要である。
- エージェントには、作業中の変化を捉えて、作業を円滑に進めるためのアクションが期待される。
- しかし、視野角の変化や定位誤差の蓄積により、観測の重複が少なく、物体の関連付けがずれるため、ロボットが周囲の変化を誤検出しやすくなる。
- 提案手法
- Neural Descriptor Fields(NDF)に基づくロバストな変化検出法
- 新規性
- 異なる視野角において、カテゴリ汎化可能な形状一貫性のある物体表現のためのNDFの利用を検討する。
- NDFから得られた物体表現と局所的な物体レイアウト比較に基づくオンライン変化検出アプローチを提案する。
- コード
- 公開なし
LayoutSLAM: Object Layout based Simultaneous Localization and Mapping for Reducing Object Map Distortion
- 論文
- 公開なし
- 課題
- さまざまな作業において、人間の代わりとなるロボットの需要が高まっています。
- 工場や店舗、公共施設などでは、荷物の運搬や清掃などのために移動型ロボットが導入されています。
- 工場や店舗では、人の作業や移動が少なくなるように机や棚が配置されています。
- また、周囲の家具も同じ場所で一つの作業ができるように設定されています。
- このような、人の作業や動作が最適化されたレイアウトの情報を使って、ロボットの知能を研究することが必要です。
- しかし、作業空間における人間の作業を容易にする家具の配置の特徴を利用した地図構築や位置推定手法は存在しない。
- 提案手法
- LayoutSLAM
- オブジェクトレイアウトに基づくオブジェクトマップの歪み低減のためのSLAM
- LayoutSLAM
- 新規性
- 人間のワークスペース内のレイアウトのグラフ表現
- レイアウトグラフを制約条件としたSLAMの提案
- 類似の机配置が多いワークスペースに対するSLAM精度の向上
- コード
- 公開なし
SLAM-Supported Self-Training for 6D Object Pose Estimation
- 論文
- 課題
- 近年の物体姿勢予測技術の進歩は、ロボットがナビゲーション中に物体レベルのシーン表現を構築するための有望な道筋を提供する。
- しかし、ロボットを新規環境に展開する際、分布外データが予測性能を低下させる可能性がある。
- ドメインギャップを緩和するために、我々は潜在的にターゲットドメインで自己学習を行うことができ、ロボットが捕捉した画像上の予測値を擬似ラベルとして用いて、オブジェクト姿勢推定器を調整することができる。
- しかし、姿勢予測は一般的に外れ値で補正されており、その不確実性を定量化することは困難であるため、低品質な擬似ラベルデータになってしまう可能性がある。
- 提案手法
- 6次元物体姿勢推定のためのSLAMサポート自己学習法
- 新規性
- ロボットが物体の姿勢を推定するための多視点で一貫した擬似学習データを生成できるSLAM支援型物体姿勢アノテーション法
- 既存のロバストM推定器と競合する、成分ごとの共分散を自動的に調整するロバストPGO法
- ロボットナビゲーションにおいて、外れ値で破壊された予測値と実際の感覚ノイズの下で6Dオブジェクト姿勢推定器のための領域ギャップを効果的に緩和できることを実証
- コード
SLAM 3
Closing the Loop: Graph Networks to Unify Semantic Objects and Visual Features for Multi-object Scenes
- 論文
- 課題
- SLAM(Simultaneous Localization and Mapping)において、過去に訪れた場所を認識する際にドリフトを最小化するために、ループクロージャー検出(Loop Closure Detection:LCD)が不可欠である。
- Visual Bag-of-Words (vBoW)は、多くの最先端のSLAMシステムで選ばれているLCDアルゴリズムである。
- vBoWは、視覚的特徴のセットを用いて頑健な場所認識を行うが、特徴点間の意味や空間的関係を認識することができない。
- これまでの研究では、主にvBoWとシーン内のオブジェクトからの意味的・空間的情報を組み合わせることで、これらの問題に対処することに重点を置いてきた。
- しかし、それらは局所的な視覚的特徴の空間情報を利用することができず、意味的なオブジェクトと視覚的特徴を一体化する構造を持たないため、2つの構成要素の共生が制限される
- 提案手法
- 多オブジェクトシーンにおけるセマンティックオブジェクトと視覚的特徴の統合を実現するグラフネットワーク
- 新規性
- セマンティックオブジェクトと視覚的な特徴を共生的に組み合わせた新しい一次元グラフ構造により、シーンの意味的・空間的な認識を向上させる。
- オブジェクトアンカーを用いた多階層グラフ形成アルゴリズム。
- 時間的制約を持つグラフカーネルを用いた新しいループ閉鎖検出システムにより、頑健かつ正確なループクローズ候補の予測を実現。
- 他のMLアルゴリズムと比較して、精度、再現率が高い。
- 従来のSLAMシステムよりもループクローズ候補を早期に検出することができる。
- コード
- 公開なし
Probabilistic Data Association for Semantic SLAM at Scale
- 論文
- 課題
- 画像処理と機械学習の進歩により、SLAM(Simultaneous Localization and Mapping)の問題にセマンティック情報を取り入れることが可能になってきた。
- 従来、SLAMは低レベルの幾何学的特徴(点、線、面)を用いて行われていたが、これらは視点に依存することが多く、視覚的に繰り返しの多い環境では誤差が生じやすい。
- セマンティック情報を用いることで、以前に訪れた場所を認識する能力を向上させ、また、長期間のSLAMアプリケーションのために疎なマップを維持することができる。
- しかし、反復的な環境におけるSLAMは、測定値を生成したランドマークに割り当てるという重大な問題を有する。
- 提案手法
- 大規模なセマンティックSLAMのための確率的データアソシエーション
- 新規性
- 近似された周辺化確率と真値との差の境界を構築する。
- 200の割り当てによるランク付け割り当て近似が、小さな問題(≒15行/col以下)では行列永久と同程度に速く、大きな問題では桁外れに速いことを示す。
- コード
Observability Analysis and Keyframe-Based Filtering for Visual Inertial Odometry with Full Self-Calibration
- 論文
- 課題
- カメラとIMU(慣性計測ユニット)のセンサーフュージョンは、ここ数十年で広く研究されています。
- 自己校正を伴う運動推定のための多数の観測可能性解析と融合スキームが提示されてきた。
- しかし、カメラとIMUの固有パラメータが一般的な運動下で観測可能であるかどうかは不明であった。
- 提案手法
- 完全自己校正を行う視覚的慣性オドメトリのための観測可能性解析とキーフレームベースフィルタリング
- 新規性
- 関連する全てのセンサーモデリングパラメータを考慮した視覚慣性システムのキャリブレーションを提唱し、徹底した観測可能性分析によってその実現可能性をサポートする
- キーフレームを用いたスライディングウィンドウフィルタ(KSWF)を提案し、キーフレームを利用して縮退した運動を処理することを提案する。
- コード
- 公開なし
OverlapTransformer: An Efficient and Yaw-Angle-Invariant Transformer Network for LiDAR-Based Place Recognition
- 論文
- 課題
- 場所認識は、複雑な環境や変化する条件下で動作する車両を自律的に航行させるための重要な能力である。
- また、SLAMにおけるループクロージングやグローバルローカライゼーションなどのタスクにおいても重要な要素である。
- 提案手法
- LiDARに基づく場所認識のための効率的なyaw角不変トランスフォーマーネットワーク
- 新規性
- LiDARデータのみを用いてSLAMのためのループ閉鎖候補を検出し、fine-tuningなしに異なる環境にうまく一般化できる
- 異なるLiDARセンサを用いて屋外大規模環境におけるHaomoデータセットで長期の場所認識を実現できる
- 提案するヨー角不変記述子により離散化誤差を含みながらも視点を変えて場所認識を行う
- 多くの最先端場所認識法より速く実行できるという主張である
- コード
Distributed Riemannian Optimization with Lazy Communication for Collaborative Geometric Estimation
- 論文
- 課題
- 幾何学的推定とは、複数のビューから幾何学的モデル(例えば、ポーズや3D構造)を推定するタスクを指し、同時定位マッピング(SLAM)や動きからの構造(SfM)などの重要なロボットアプリケーションの基礎となる技術である。
- マルチロボットシステムや複合現実感などの新しいアプリケーションでは、協調的な幾何学的推定により、複数のエージェントが共有の幾何学的モデル(例えば、大規模な3Dマップ)を構築し使用することができます。
- このプロセスの核となるのは、すべてのエージェントによって収集された測定値を融合して、グローバルな幾何学モデルを生成する大規模な最適化である。
- 既存のマルチエージェントシステムでは、バンドル調整(BA)のような前述のグローバル最適化を、中央サーバや基地局に負荷することが多い。
- しかし、ロボットの数やミッションの時間が増えるにつれて、中央最適化は問題サイズが大きくなり、最終的にサーバーが計算ボトルネックになることに悩まされます。
- 提案手法
- 協調的幾何学的推定のための遅延通信を用いた分散リーマン最適化
- 新規性
- 参加エージェントのプライバシーを保護すると同時に、近似的な2次更新を実行する分散法を設計する
- エージェントが特定の通信トリガー条件を満たす局所情報の部分のみを送信することを可能にする遅延通信
- コード
- 公開なし
CFP-SLAM: A Real-time Visual SLAM Based on Coarse-to-Fine Probability in Dynamic Environments
- 論文
- 課題
- 環境中の動的な要因は、SLAMアルゴリズムの静的環境仮定に反するため、カメラ位置決め精度の低下を招く。
- 近年では、意味的制約と幾何学的制約を組み合わせて動的な物体を扱う手法が一般的であるが、リアルタイム性が低い、人物を剛体として扱いやすい、低ダイナミックシーンでの性能が低いなどの問題が指摘されることがある。
- 提案手法
- CFP-SLAM(Coarse-to-Fine Probability SLAM)
- 物体検出と粗密静的確率に基づく動的シーン指向の視覚的SLAMアルゴリズム
- CFP-SLAM(Coarse-to-Fine Probability SLAM)
- 新規性
- EKFとHungarianアルゴリズムに基づくミス検出の補正、およびDBSCANクラスタリングアルゴリズムによる箱の前景点と後景点の識別。
- オブジェクトの動的属性の区別
- 非剛体局所運動による静的キーポイントの誤削除問題を解決するために、物体の静的確率、DBSCANクラスタリングアルゴリズム、エピポーラ制約、投影制約に基づく2段階の静的キーポイント確率計算法を提案
- コード
- 公開なし
Object-Plane Co-Represented and Graph Propagation-Based Semantic Descriptor for Relocalization
- 論文
- 課題
- ロボットアプリケーションにおいて再ローカライゼーションは重要な要素であるが、照明条件、天候、視点が変化するため、課題が生じる。
- 画像特徴量に基づく手法は外観に敏感であり、高レベルの意味的ランドマークに基づく手法は曖昧であり、位相的マップマッチングに基づく手法は利用可能なソリューションの中で十分にロバストでない。
- 提案手法
- オブジェクト-プレーン共表現とグラフ伝搬に基づく再ローカライゼーション用セマンティック記述子
- 新規性
- オブジェクトと平面を組み合わせたトポロジカルグラフを生成し、この共同表現によりグラフマッチングと姿勢最適化の両方を容易にする
- グラフ伝搬理論に基づき,共観測物体の割合が少ない場合でも有効な意味的記述子を抽出する手法を提案する.
- 記述子抽出、グラフマッチング、姿勢最適化を組み合わせることで、大規模な視点に直面した場合、外観や点群登録に基づくアプローチを凌駕し、精度と速度を大幅に改善した再ローカライゼーションシステムを構築する。
- コード
- 公開なし
Certifiably Optimal Mutual Localization with Anonymous Bearing Measurements
- 論文
- 課題
- マルチロボットシステムにおける協調・協力には、相互の位置特定が不可欠である。
- これまでの研究では、測定値と受信したオドメトリ推定値の間の対応関係が利用可能であると仮定することで、この問題に対処してきた。
- しかし、特に単一ロボットチームの場合、対応関係を取得することは困難である。
- 提案手法
- 匿名ベアリング測定による証明可能で最適な相互位置検出
- 新規性
- MIQCQP問題において、データの関連付けと相対的なポーズを共同で解く革新的な定式化を提供する
- 非凸のMIQCQP問題に対して半正定値緩和(SDR)を採用し凸にするアルゴリズムを提案する
- コード
LF-VIO: A Visual-Inertial-Odometry Framework for Large Field-Of-View Cameras with Negative Plane
- 論文
- 課題
- 視覚・慣性・オドメトリは、自律走行やロボティクスの分野で広く注目されている。
- 視覚オドメトリ(VO)や視覚慣性オドメトリ(VIO)では、FOV(Field of View)の大きさが重要な役割を果たす。
- FOVが大きければ、周囲の様々な要素や特徴を認識することができるからである。
- しかし、カメラの視野が負の半値面に達すると、画像の特徴点を単純に$[u, v, 1]^T$で表現することができなくなる。
- 提案手法
- LF-VIO(Large Field-Of-View Visual Inertial Odometry)
- ネガティブ面を持つ大視野カメラ用視覚-慣性-オドメトリフレームワーク
- LF-VIO(Large Field-Of-View Visual Inertial Odometry)
- 新規性
- 大きな視野を持つカメラのための視覚-慣性-オドメトリフレームワークであるLF-VIOを提案する。
- 負半平面上の特徴点をサポートするためのロバストな初期化方法とアルゴリズム調整を提案する。
- PALVIOは、Panoramic Annular Lens (PAL) システムとIMUセンサーで収集されたデータセットで、モーションキャプチャデバイスを介して得られたground-truth位置と姿勢を用いて作成され、公開されています。
- コード
SLAM 4
Group-k Consistent Measurement Set Maximization for Robust Outlier Detection
- 論文
- 課題
- SLAMは、ポーズや環境の特徴を含む変数ノードと、ファクタノードを持つファクタグラフとして表されることが多い。
- この問題は、ロボットの軌道に沿って行われた測定値が与えられたときの、軌道の最尤推定値(MLE)として定式化される。
- 計測モデルとプロセスモデルに独立性と加法性ガウスノイズを仮定すると、これは非線形最小二乗問題となり、利用可能なソルバを用いて高速に解くことができる。
- しかし,非線形最小二乗法は外れ値の影響を受けやすく,非オドメトリック測定に対する正確な係数を確実に決定することは困難である.
- 外れ値検出の古典的なアプローチ(拒絶ゲートなど)は、測定値をインライアーとアウトライアーに分類する。
- 我々の先行研究では問題は、ペアワイズで一貫した測定値の最大のセットを作成しようとする組合せ最適化問題として定式化されましたが、ペアワイズ一貫性のチェックが十分ではなかった。
- 提案手法
- 内部的にgroup-k一貫性を持つ測定の最大集合を推定するgroup-k一貫性最大化(GkCM)
- 新規性
- 以前の研究をペアワイズ一貫性のチェックが十分でないシナリオに一般化する。
- ペアワイズ整合性最大化の概念をgroup-k整合性最大化に拡張し、kタプルエッジを持つ一般化グラフの最大クリークを見つけることによって解決できることを示す。
- 既存のグラフ理論のbranch and bound/heuristic algorithmを一般化し、一般化グラフの最大クリークを効率的に探索する。
- 移動体が静的ビーコンへの距離計測を行うレンジベースSLAMシナリオに本研究を適用する。
- 提案したアルゴリズムの並列化された実装をリリースします。
- コード
Floorplan-Aware Camera Poses Refi nement
- 論文
- 課題
- 大規模な屋内シーンの処理は、スキャンレジストレーションとカメラ軌道推定方法が時間の経過とともにエラーを蓄積するため困難な作業です。
- 再構築されたスキャンの品質は、ビジュアルベースのローカリゼーションやナビゲーションなど、壁の正しい位置が重要な一部のアプリケーションでは不十分です。
- 提案手法
- 従来のバンドル調整(BA)を拡張し、フロアプランの形でシーン構造に関する事前知識を活用する新しい最適化アルゴリズム
- 新規性
- スキャンをフロアプランと位置合わせし、幾何学的一貫性を改善する。
- 深度マップを使用して3D空間に逆投影された一致したキーポイント間の距離にペナルティを与える。
- スキャン内の床と壁を検出するためにセマンティックセグメンテーションを使用する。
- スキャンをフロアプランと位置合わせし、幾何学的一貫性を改善する。
- コード
- 公開なし
MOTSLAM: MOT-assisted monocular dynamic SLAM using single-view depth estimation
- 論文
- 課題
- 単元カメラベースのVisual SLAMは、その単純さと費用対効果の点で大きな利点があるため、多くのロボットシステムで利用されている。
- SLAMの用途が拡大するにつれて、動的オブジェクトの理解が重要になってきた。
- 最近ではVisual SLAMにオブジェクト検出やセマンティックセグメンテーションなどの深層学習技術との組み合わせにより、動的オブジェクトを扱う新しい可能性がもたらされている。
- しかし単眼画像のみで動的SLAMを実行することは、動的特徴を関連付けてその位置を推定することが難しいため、依然として困難な問題となっている。
- 提案手法
- MOTSLAM
- 動きや物体の事前情報を追加することなく、6DoFのカメラ姿勢と周囲の物体の3次元境界ボックスを追跡できる単眼フレームを用いた動的視覚SLAM
- MOTSLAM
- 新規性
- 2D/3D物体検出、セマンティックセグメンテーション、単眼深度推定を組み込んだフレームワーク
- 単眼カメラによる深度推定
- 最初にMOTによって支援された物体の高レベルの関連付けを、低レベルの特徴の関連付けの前に実行し、低レベルの関連付けのパフォーマンスと堅牢性を向上させる。
- 物体のポーズと形状は、MOTからの関連する3D物体検出によって正確に初期化され、バックエンドの物体バンドル調整によって洗練される。
- 2D/3D物体検出、セマンティックセグメンテーション、単眼深度推定を組み込んだフレームワーク
- コード
- 公開なし
Gravity-constrained point cloud registration
- 論文
- 課題
- ライダーに依存するSLAMフロントエンドソリューションは、一般的に、オリジナルのICPアルゴリズムの変種を使用して現在のスキャンを登録することにより、環境の3Dマップを構築する。
- ICPアルゴリズムは局所的な鮮明なマップを保証しますが、必然的にグローバルドリフトに悩まされます。
- このドリフト問題は、ポーズグラフ最適化を適用したSLAMバックエンドによって軽減することができますが、ポーズグラフ最適化器に依存しておりすべての変換について共分散行列の形式で不確実性の推定を必要とします。
- ICPによって生成された制約を追加する場合、不確実性を学習またはサンプリングすることができますが、ガウス分布の仮定は複雑な3D環境ではうまく保持できないことが示されている。
- 提案手法
- IMUの姿勢の直接観測可能なDOFを利用したICPアルゴリズムの密結合バリエーション
- 新規性
- 重力ベクトルから観測可能なDOFを利用するために、ICP最小化プロセスを直接修正することを提案する。
- 局所的なポーズ推定値の垂直方向と軸方向のドリフトを制限しながら、4-DOF空間におけるポーズ推定値を探索する。
- 重力ベクトルから観測可能なDOFを利用するために、ICP最小化プロセスを直接修正することを提案する。
- 効果
- 提案手法で求めた4-DOFの姿勢と古典的なICPアルゴリズムによる6-DOFの姿勢を比較。
- 大規模な屋外環境と国防高等研究計画局(DARPA)の地中チャレンジ(Subterranean Challenge)にてテスト
- 垂直ドリフトを制限することによって、6-DOF ICPと比較して正規化されたATE中央値を30%削減
- コード
- https://github.com/norlab-ulaval/norlab_icp_mapper
- libpointmatcherライブラリの一部として利用可能
When Geometry is not Enough: Using Reflector Markers in Lidar SLAM
- 論文
- 課題
- LIDARベースのSLAMシステムは、環境のジオメトリに依存することで、さまざまな状況で適切に機能します。
- ただし、成熟した信頼性の高いアプローチでさえ、長い廊下などの構造のない領域が環境に含まれている場合は困難です。
- 提案手法
- 目立たない反射板マーカーを設置し、このマーカーをライダーSLAMシステムのオドメトリに使用する
- 新規性
- 様々なライダーセンサーに容易に適用でき、レーザースキャン中のリフレクタマーカーを確実に検出するアルゴリズム。
- 他のマーカーを用いた手法との違い、マーカーの位置が事前に分かっていることや、特別な配慮がなされていることを前提とせず、困難な領域を十分にカバーすることができる。
- 異なる2つの手法を提案
- NDTレイヤーアプローチ
- NDTトラッキングアプローチ
- 様々なライダーセンサーに容易に適用でき、レーザースキャン中のリフレクタマーカーを確実に検出するアルゴリズム。
- コード
- 公開なし
LOCUS 2.0: Robust and Computationally Efficient Lidar Odometry for Real-Time 3D Mapping
- 論文
- 課題
- LiDARオドメトリは、複雑なGNSS拒否環境で動作する自律型ロボットの堅牢な位置特定方法としてかなりの注目を集めています。
- しかし、大規模環境の異種プラットフォームで信頼性の高い効率的なパフォーマンスを実現することは、自律動作に必要なオンボード計算とメモリリソースの制限により、未解決の課題として残っています。
- 前バージョンのLOCUS 1.0は、高精度なオドメトリと3Dマッピングのためのマルチセンサー・ライダー中心のソリューションで、多段スキャンマッチングモジュール、健康を考慮したセンサー統合、疎結合方式での追加のセンシングモダリティを備えています。
- 知覚的に劣化した環境において顕著な精度とロバストを達成しましたが、i)計算負荷が大きい、ii)グローバルマップをメモリ内に保持する、iii)ライダーセンサーの1つの故障など、より一般的なセンサー故障に対するロバストが低い、などの欠点がありました。
- 提案手法
- LOCUS 2.0
- リアルタイムの地下3Dマッピングのための堅牢で計算効率の高いLiDARオドメトリシステム
- LOCUS 2.0
- 新規性
- GICP from normals: GICP (Generalized Iterative Closest-Point) の新しい定式化で、点群の法線を利用して点共分散計算を近似し、計算効率を向上させる。
- Adaptive voxel grid filter: 周辺環境やライダーに依存せず、決定性かつほぼ一定な実行時間を保証。
- 2マップスライディングウィンドウアプローチによるグローバルマップ保持に必要なメモリの削減
- 困難な実環境の地下空間(都市、トンネル、洞窟)を含むデータセットのリリース。
- 11時間の運用と16kmの移動距離
- 効果
- LOCUS1.0と比較して、CPU使用率の増加と低メモリ性を確認。
- 提案したデータセットでFAST-LIOとLINSとの比較
- max APE、mean APEに関しては安定した性能を実現、データセットによっては比較対象を上回る。
- コード
The Hilti SLAM Challenge Dataset
- 論文
- 課題
- 同時ローカリゼーションとマッピング(SLAM)の研究は、過去数年間で目覚ましい進歩を遂げてきました。
- SLAMシステムは、今日、学術アプリケーションから実世界のアプリケーションに移行しています。
- ただし、この移行により、精度と堅牢性の点で新たな厳しい課題が生じました。
- これらの課題に対処できる新しいSLAMシステムを開発するには、最先端のハードウェアと現実的なシナリオを含む新しいデータセットが必要です。
- 提案手法
- Hilti SLAM Challenge Dataset
- 新規性
- 屋内のオフィスやラボ、屋内および屋外の建設環境、および困難な特徴のない領域とさまざまな照明条件を含む屋外の駐車場で記録された実世界のシーケンス。
- 5台のカメラ(1つのステレオペア)、2つのLiDAR、および正確な空間的および時間的キャリブレーションを備えた3つのIMUを含むセンサースイート。
- コード
Photometric single-view dense 3D reconstruction in endoscopy
- 論文
- 課題
- 人体内のビジュアルSLAMは、内視鏡検査におけるコンピューター支援ナビゲーションへの道を開きます。
- しかし、スペースの制約により医療用内視鏡は単眼画像しか提供せずシステムは真のスケールを欠いています。
- 提案手法
- 大腸内視鏡の照明制御を利用し較正された単眼内視鏡で測光ステレオを用いてヒト大腸の生体内3D再構成
- 新規性
- 内視鏡光とカメラの簡単な測光モデル
- ランバートパターンを必要とせず、病院内でその場実施可能な測光校正法
- 校正した従来の単眼内視鏡の照明光のみから人間の大腸の形状を再構成できる初の方法
- コード
- 公開なし
Continuous-Time Stereo-Inertial Odometry
- 論文
- 課題
- SLAM最適化問題は、伝統的に動き推定とマッピングのための最も有益な状態(例えば、視覚的SLAMのキーフレーム)からなる離散的なセットに対して提起されてきており、現実的なハードウェア制約の下で問題の成長を効果的に扱いやすいものにしている。
- これらの技術に共通する困難は、離散化された運動学的制約を必要とする状態間運動情報の欠如、量子化誤差の導入、および(非同期)マルチレートセンシングモダリティの厄介な統合/同期化にある。
- 連続時間同時ローカリゼーションとマッピング(CTSLAM)の新たなパラダイムは、最近の従来の離散時間アプローチの競争力のある代替手段になり、マルチモーダルセンサーのセットアップを真に一般的な方法で融合するという追加の約束を保持しており、ロボットナビゲーションと操作にとってその重要性を独創的にしています。
- 提案手法
- HyperSLAMを拡張した、新しいステレオ・慣性CTSLAMパイプライン
- 新規性
- 一般的な実世界の設定における連続時間法の適合性を調査する
- これらのアプローチをオンライン(すなわち、非バッチ)操作および立体慣性の場合の領域に拡張する
- 提示されたアルゴリズムの広範かつモジュール式のオープンソース実装を提供する
- 効果
- 比較可能でオープンなオンラインCTSLAMが存在しないため、他の最先端離散時間アプローチと比較。
- KITTIデータセット
- ORB-SLAM3、VINS-Fusion、提案手法で比較
- ほとんどの項目においてORB-SLAM3に関して同様のパフォーマンスを達成し、VINSS-Fusionよりもほぼ一貫して良好な推定値を達成
- EuRoC(Stereo)データセット
- ORB-SLAM3、SVO、VINS-Fusion、提案手法で比較
- EuRoC(Stereo-Inertial)データセット
- ORB-SLAM3、OKVIS、VINS-Fusion、提案手法で比較
- SVOおよびOKVISと同等のVINS-Fusionよりもかなり優れており、RMSEに関してはORB-SLAM3[9]よりも劣っている。
- コード
SLAM 5
InCOpt: Incremental Constrained Optimization using the Bayes Tree
- 論文
- 課題
- 状態推定とSLAMは、一般に、変数ノードが状態を表し、因子ノードがソフト制約として事前分布または観測尤度をコード化する因子グラフ推論問題として定式化される。
- 多くのシナリオでは、事前分布と観測値の両方がハード制約としてモデル化される方が良い。
- 例えば、ロボットの指が物体に触れたときの接触観測は、制約としてモデル化する方が良い。
- このようなハード制約が存在する場合、どのようにすれば効率的に推論を行うことができるだろうか?
- 先行研究では、この問題をincremental constrained smoothing (ICS)として定式化しています。
- ICSの主な限界は、行列分解の初期状態において、固定された線形化点を仮定することである。このため、頻繁な再線形化を必要とする非線形問題には不向きです。
- iSAM2は、グラフィカルモデルとスパース線形代数の間の接続を利用し、これらの制限に対処しているがハードな制約を扱えず無制約な場合のみで機能する。
- 提案手法
- InCOpt
- ベイズツリーのデータ構造を利用して、オンライン再線形化を伴う困難な制約を扱うインクリメンタル制約付き最適化
- InCOpt
- 新規性
- ベイズツリー上のメッセージパッシングとして定式化されたプライマル-デュアルの制約付き最適化フレームワーク。
- 時間ステップ毎に解をゼロから再計算することなく、オンライン再線形化により制約付き目的を効率的に解く新アルゴリズム。
- オープンソースコードと、ナビゲーションや操作などの様々なタスクに関する実証評価.
- コード
- 公開なし
S3LAM: Structured Scene SLAM
- 論文
- 課題
- 従来のSLAMアルゴリズムは過去数年で多くの改善が見られたため、カメラの姿勢を正確に推定できるようになってきた。
- しかし、マップは疎、半密などのさまざまな形式を取ることができますが、常に純粋に幾何学的であり、SLAMをより堅牢で正確にするための重要な情報である意味的意味を欠いています。
- 提案手法
- S3LAM
- 構造化シーンSLAMのための単眼SLAMシステム
- S3LAM
- 新規性
- ORB-SLAM2をベースに以下の点を追加
- シーン内のオブジェクトインスタンスを検出して、そのようなオブジェクトに対応する3Dポイントのクラスタを作成できるSLAMフレームワーク。
- クラスタから構造を推論し、そのような推定を与えられたマップを制約することができる単眼SLAMシステム。
- いくつかの公開データセットからのシーケンスに対する我々のアプローチの評価は、カメラのポーズ精度の観点から我々の方法の利点を実証する。
- ORB-SLAM2をベースに以下の点を追加
- 効果
- TUMdデータセット
- ORB-SLAM2と他数種類の手法と比較
- 提案手法が平面シーンを優先して広範囲のシーンにおけるカメラ姿勢推定を改善するので一般化可能であることを示している。
- 他のアプローチは物体を含むシーンまたは完全に平面のシーンのいずれかに焦点を当てているため得手不得手がある。
- KITTIデータセット
- ORB-SLAM2と比較
- 全てのシーケンスにおいてATE(cm)が改善
- TUMdデータセット
- コード
- 公開なし
Fast Structural Representation and Structure-aware Loop Closing for Visual SLAM
- 論文
- 課題
- SLAMは、様々な自律システムに適用可能な基本的な処理であり、マッピング処理中のアクチュミレーションエラーを修正するためにループクロージングが使用されます。
- しかしループクロージングは知覚的エイリアシングの問題を引き起こす可能性があり、これは依然として重要でSLAMを失敗させる。
- 提案手法
- Visual SLAMのための球面調和(SH)に基づく高速構造表現(SH-FS)
- 新規性
- 自由空間を考慮することで、疎な3次元点から構造情報を抽出できるSH-FSの提供
- SH-FSと従来の特徴量に基づく検出手法を組み合わせた、構造を考慮したループクロージャ―検出手法の提案
- 高速かつロバストなループクロージャ―故障検出手法の提案
- 効果
- 構造表現の生成と自由空間チェック処理のどちらかにかかる時間は比較的小さい
- パラメータチューニングに依存しないロバスト性を確認
- LIOであっても回避できない屋内の誤ループを高精度に検出できる
- Pose Graph Optimizationアルゴリズムに依存しない
- 手法の限界
- 100%の故障検知を保証しない
- ループの大きさが非常に小さい、もしくは大きい場合にはこの手法は失敗する可能性がある。
- 地図のサイズが大きくなると本手法を適用しても時間効率の向上は機体できない。
- コード
- 公開なし
Efficient 2D Graph SLAM for Sparse Sensing
- 論文
- 課題
- 最近の研究では、小型で機敏、かつ安価なナノドローンが、危険な屋内探査ミッションを遂行する可能性が示されている。
- しかし、これらナノドローンはバッテリーや積載量が限られており、まばらでノイズの多い測定しかできない低電力センサーしか搭載できない。
- そのため従来のSLAMソリューションのようにLiDARのような高精度のセンサーは使用できない。
- その結果、限られたセンシング能力により困難なSLAM問題が発生します。
- 提案手法
- スパースセンシングのための効率的な2DグラフSLAM
- 新規性
- スパースなレンジデータのためのフロントエンドとして、スキャンマッチングに代わる新しいランドマークグラフを提案
- ループクローズのために、スキャン中の各点を地図中の特定のセルではなく、セルの近傍にマッチングさせる近似マッチングヒューリスティックを提案
- コード
- 公開なし
Spectral Measurement Sparsification for Pose-Graph SLAM
- 論文
- 課題
- 同時位置特定とマッピング(SLAM)は自律ナビゲーションの重要な機能ですが、特にメモリや計算の制約の下で、SLAMを「生涯」SLAMの設定に拡張するには、ロボットが保持すべき情報と安全に忘れることができる情報を決定できる必要があります。
- グラフベースのSLAMでは、ポーズグラフのエッジ(測定値)の数によって、ロボットの観測を保存するためのメモリ要件と、それらの観測を使用して状態推定を実行するために展開されたアルゴリズムの計算費用の両方が決まります。
- どちらも、長期的なナビゲーション中に無制限に成長する可能性があります。
- 提案手法
- ポーズグラフSLAM解の推定誤差を制御するために示されているキー量である、スパース化された測定グラフの代数的接続性を最大化するポーズグラフスパース化のためのスペクトルアプローチ
- 新規性
- 凸緩和に基づくこの方法は単純で計算コストが低く,解の品質に対する形式的事後性能保証が可能
- コード
- 公開なし
BOEM-SLAM: A Block Online EM Algorithm for the Visual-Inertial SLAM Backend
- 論文
- 公開なし
- 課題
- SLAM(Simultaneous Localization and Mapping)は、ロボットがそのような空間的な関係をインテリジェントかつ自律的に獲得することを可能にします。
- 30年間の広範な研究の後、私たちは現在、ORB SLAMシリーズやVINO-Monoなど、前例のない性能を達成する視覚慣性システムのための高度なSLAMアルゴリズムを持っています。
- 一般的に、視覚的慣性SLAMシステムは、フロントエンドとバックエンドに分けられます。
- フロントエンドからの軌道には必然的なドリフトがありますが、バックエンドはフロントエンドからの結果を取得し、グローバルに一貫した軌道とループクロージャ付きのマップを計算します。
- グローバルに一貫したソリューションを推論する計算は複雑であるため、バックエンドはSLAMシステムの実行にかかる時間を決定する主要な要因です。
- 提案手法
- BOEM-SLAM(Block Online EM Algorithm SLAM)
- データの履歴全体を保持せずにグローバルに一貫した軌道とマッピングを作成できる視覚慣性SLAMシステムのバックエンド
- BOEM-SLAM(Block Online EM Algorithm SLAM)
- 新規性
- 隠れマルコフモデル構造を活用することで、過去のデータをランドマーク推定値と最新の状態分布に要約
- 要約された過去情報によるバックエンドのオンライン処理化
- 効果
- EuRoCデータセット
- 比較対象:最適化ベースのSLAM、EM-SLAM、BOEM-SLAM(提案手法)
- 処理時間:提案手法はデータセットの種類によらず一貫して40sec未満。最適化手法はデータセットによってはBOEM-SLAMの5倍程度時間がかかる。
- 絶対軌道誤差:最適化ベースの手法が最も安定し、EM-SLAMとBOEM-SLAMは同程度
- EuRoCデータセット
- コード
- 公開なし
RO-LOAM: 3D Reference Object-based Trajectory and Map Optimization in LiDAR Odometry and Mapping
- 論文
- 課題
- 目視検査にUAVが使われることが多くなっています。
- このような用途ではなるべく対象物に近づく必要があるため、高精度なSLAMとナビゲーションが要求される。
- 提案手法
- RO-LOAM(Reference Object LOAM)
- 参照オブジェクトベースの軌道とマップの最適化(TMO)のためのアプローチ
- RO-LOAM(Reference Object LOAM)
- 新規性
- LOAMをベースにした、参照オブジェクトに基づく軌道とマップの最適化
- 参照オブジェクト:ビルディングインフォメーションモデリング(BIM)のCADモデルや以前にキャプチャされた高密度点群モデル
- 従来技術(R-LOAM)と比べ
- マップ補正機能だけを別のLiDAR-SLAMアルゴリズムに統合可能
- エッジクラウド上で完全並列化されたオンライン実行が可能
- LOAMをベースにした、参照オブジェクトに基づく軌道とマップの最適化
- コード
- 公開なし
TwistSLAM: Constrained SLAM in Dynamic Environment
- 論文
- 課題
- Visual-SLAMアルゴリズムは通常、環境が厳格であることを前提としています。
- この仮定は、動く物体(車、自転車、歩行者など)を含む実際のシーンでカメラの姿勢と世界構造を正確に推定することができないため、これらのアルゴリズムの適用性を制限します。
- 提案手法
- TwistSLAM
- 環境内の動的オブジェクトを追跡できるセマンティック、動的、ステレオSLAMシステム
- TwistSLAM
- 新規性
- 静的および動的なシーンにおいてカメラの姿勢を頑健に推定するセマンティックSLAMシステム
- シーン内の複数の移動物体を追跡することができるステレオSLAMフレームワーク
- シーン内のオブジェクトの動きを拘束するために、オブジェクト間の機械的なジョイントの特性を考慮した、トラッキングとバンドル調整の両方のための新しい定式化
- 効果
- KITTIデータセット
- 比較対象: ORB-SLAM2,DynaSLAM,VDO-SLAM,DynaSLAM II、Twist-SLAM(提案手法)
- カメラポーズ推定:いくつかのシーケンスにおいて、提案手法がRPEを改善
- オブジェクトポーズ推定(軌道):ほぼすべての場面において、提案手法がATとRPEを改善。
- オブジェクトポーズ推定(バウンディングボックス):比較対象に比べ静的オブジェクトのトラッキング精度向上
- KITTIデータセット
- コード
- 公開なし
Fast Sparse LiDAR Odometry Using Self-Supervised Feature Selection on Intensity Images
- 論文
- 課題
- 従来のLiDAR点群を用いたオドメトリ推定手法は点群同士のマッチング手法に依存している(例えば、ICP)。
- この手法は一般的に大量のデータを処理するため、点群の多いLiDARでは特に困難。
- 提案手法
- LiDARスキャンの強度チャネルを利用してシーン内の顕著な点を抽出し、それらを使用してオドメトリをより効率的に計算
- 新規性
- RGB画像用に設計されたデータ駆動型の特徴抽出アーキテクチャSuperPointを使用し強度画像からオドメトリを計算
- 相対的なポーズによって与えられた情報を使用して、擬似グラウンドトゥルースの顕著なポイント位置を生成し、それらをネットワークを介して逆伝播させてモデルを更新する。
- 効果
- データセット
- MulRanとNewer Collegeのデータセット
- 比較対象
- 提案手法:SLO(オンラインファインチューニングなし)、SLO++(オンラインファインチューニングあり)
- 比較対象:ICP, ICP-P2P, G-ICP, G-ICP-D、Suma-f2f
- 実行時間
- SLO(50Hz以上)、SLO++(最大30Hz)で動作する
- オドメトリ性能
- 一番性能が良いのはG-ICP、次点でSLO++。
- オンラインファインチューニング
- SLO++はSLOに比べて時間の経過とともに性能を改善できる。
- データセット
- コード
- 公開なし
SLAM 6
LAMP 2.0: A Robust Multi-Robot SLAM System for Operation in Challenging Large-Scale Underground Environments
- 論文
- 課題
- 未知の大規模な地下環境で異種移動ロボットのチームによる捜索救助には、高精度のローカリゼーションとマッピングが必要です。
- この重要な要件は、オンボードの知覚システムが公称外の条件(暗闇やほこりによる視界不良、険しく泥だらけの地形、自己相似で曖昧なシーンの存在)で動作する必要があるため、複雑で知覚的に劣化した地下環境で多くの課題に直面しています。
- 災害対応シナリオでは、環境に関する事前情報がない場合、ロボットはノイズの多いセンサーデータに依存し、同時位置特定とマッピング(SLAM)を実行して、環境の3Dマップを構築し、自分自身と潜在的な生存者を特定する必要があります。
- 提案手法
- LAMP 2.0:困難な大規模地下環境での運用のための堅牢なマルチロボットSLAMシステム
- 新規性
- DARPA Subterranean Challenge の一環として開発された、大規模な地下環境での運用に適した、計算効率が高く、外れ値に強い中央集中型のマルチロボット SLAM システム。
- ループクロージャー検出モジュールは、急速に増加するループクロージャー候補を処理し、優先順位をつけることができ、検出されたループクロージャーの精度と堅牢性を向上させる最新の3D登録技術を含んでいる。
- 外れ値に強いバックエンドは、姿勢グラフ最適化のための卒業した非凸(38)をベースにしている。
- LAMP 2.0のオープンソース公開と、洞窟、鉱山、廃発電所のポーズグラフと点群を含む地下環境のマルチロボットデータセット、および専門的に調査されたデータに基づくグランドトゥルース軌道と地図。
- DARPA Subterranean Challenge の一環として開発された、大規模な地下環境での運用に適した、計算効率が高く、外れ値に強い中央集中型のマルチロボット SLAM システム。
- コード
Loop Closure Prioritization for Efficient and Scalable Multi-Robot SLAM
- 論文
- 課題
- GPSが拒否された環境でのマルチロボットSLAMシステムでは、ドリフトのない集中型マップを維持するためにループクロージャが必要です。
- ロボットの数と環境のサイズが増えるにつれて、すべてのループ閉包候補の変換をチェックして計算することは計算上実行不可能になります。
- さらに、すべてのループクロージャーがSLAMソリューション全体の改善につながるわけではありません。
- 実際、平行廊下のような多くのループクロージャーは誤検出であり、これらのループクロージャーを追加するとSLAMソリューション全体が劣化してしまう可能性があります。
- 提案手法
- 効率的でスケーラブルなマルチロボットSLAMのためのループクロージャの優先順位付け
- 新規性
- ループクロージャーをシステムに追加することによる予測誤差の減少、ループクロージャー候補の点群の観測可能性、および人工無線ビーコンによって知らされる場所の近接性に基づいて、ループクロージャー優先順位付けのためのアプローチ
- 大規模な地下環境において、複数のロボットを用いて上記3つのアプローチの性能を実証する実験を行い、優先順位付けを行わないベースラインと比較して、中央値の誤差が平均75%減少することを示す
- コード
Keeping Less Is More: Point Sparsification for Visual SLAM
- 論文
- 課題
- SLAM(Simultaneous Mapping and Localization)を自律走行車、ドローン、拡張現実デバイスなどの実世界のアプリケーションに適用する場合、そのメモリフットプリントと計算コストが性能と適用範囲を制限する2つの主要因である。
- このようなリソース要求の増大に対処するための既存手法は、ポーズ精度を犠牲にしながらも、データサイズと計算コストのいずれかを削減することに重点を置いている。
- 提案手法
- 任意の特徴ベースの視覚SLAMパイプラインに直接組み込むことができる効率的なポイントスパース化アルゴリズム
- 新規性
- 点の可視性を最大化するためのカメラ姿勢ペアと3次元点のグラフ表現を提案
- 画像空間上の2次元特徴の空間的多様性を最大化するための新しいコストを提案
- 残りの点数を制御するための最小コストの最大フローベースの点スパース化アルゴリズムを提案
- 様々な屋内/屋外公共データセットによる詳細な姿勢精度、点数削減、速度改善比較を提供
- コード
- 公開なし
Online Extrinsic Correction of Multi-Camera Systems by Low-Dimensional Parameterization of Physical Deformation
- 論文
- 公開なし
- 課題
- マルチカメラ設定を使用する一般的なビジュアルSLAMシステムでは、カメラの内因性および外因性パラメータは、オンライン実行の固定制約として使用されるオフラインキャリブレーションによって計算されます。
- ただし、カメラリグは衝撃や振動によって物理的に変形する可能性があり、オフラインキャリブレーションパラメーターからの偏差は、三角測量と姿勢推定の精度に悪影響を与える可能性があります。
- したがって、実行中にカメラリグの正確なキャリブレーションを継続的に維持することが重要です。
- 以前のオンラインキャリブレーション方法では、再投影誤差を最小限に抑えることで、外部カメラのパラメータを完全自由度(DoF)で最適化していましたが、オンラインで入手できる視覚情報が限られているため、結果として得られるカメラの姿勢に偏りが生じる可能性があります。
- 提案手法
- 物理変形の低次元パラメータ化によるマルチカメラシステムのオンライン外因性補正
- 新規性
- カメラシステムの物理モデルをシミュレータで構築し、様々な外乱による実際の変形を記録し、その変形パターンをPCAアルゴリズムでモデル化して低次元モデルを構築する。
- オンライン実行では、すべてのカメラポーズを独立して最適化するのではなく、事前に学習した低次元パラメタリゼーション内の視覚的特徴の再投影誤差を最小化することでカメラポーズを更新する。
- コード
- 公開なし
Active SLAM in 3D Deformable Environments
- 論文
- 公開なし
- 課題
- 変形可能な環境におけるSLAMは、ロボットの動作追跡や低侵襲ロボット手術のような多くの異なる分野で幅広く応用されているため、重要な再検索テーマとなっています。
- 変形可能な環境におけるSLAMでは、ロボットやセンサーに適した軌道を計画することが重要であり、また挑戦的でもあります。
- このような動的環境でロボットが様々な状況に応じてオンラインで制御動作を決定できれば、より望ましい。
- 変形環境におけるアクティブSLAM問題は、3次元変形環境においてはまだ研究されていない。
- 提案手法
- 3D変形可能な環境におけるアクティブSLAM
- 新規性
- EKFに基づくアクティブSLAMフレームワークを、SLAM結果を正確かつ効率的に推定するために設計する
- 効率的なグローバルプランナーと高精度なローカルプランナーの組み合わせ
- コード
- 公開なし
Event-Based Line SLAM in Real-Time
- 論文
- 課題
- イベントベースのカメラは、シーン内の明るさの対数変化に比例してトリガーされるイベントの非同期ストリームを生成します。
- これらのカメラは、ロボット工学における困難なモーションシナリオに対処するのに適した非常に低い遅延と高いダイナミックレンジを備えています。
- しかし、イベントベースカメラの特徴から標準的なコンピュータビジョンアルゴリズムは直接適用できない。
- 従来の研究では、出力ダイナミクスの制限や高い計算コストが課題となっている。
- 提案手法
- リアルタイムでのイベントベースのラインSLAM
- 新規性
- トラッキング
- Lie理論で定式化されたエラー状態カルマンフィルタを用いてイベントラインの再投影誤差を最小限に抑えることで、kHzオーダーのレートで正確なカメラ姿勢推定を行う
- マッピング
- イベントベースカメラの幾何学的な形状のエッジを自然に強調するという特徴を使い、シーンに存在するオブジェクトの直線エッジから、3次元線の疎なセットを検出、抽出、最適化する。
- トラッキング
- コード
- 公開なし
MR-TopoMap: Multi-Robot Exploration Based on Topological Map in Communication Restricted Environment
- 論文
- 課題
- 未知の環境でのマルチロボット探査は、メッセージを介したロボット間通信を行い、ロボット間の相対的な姿勢を計算し、各ロボットが構築したマップをマージするマルチロボットシステムの基本的なタスクです。
- しかし、通信が制限された環境では、占有グリッドマップに大量のデータが存在するため、限られた通信リソースがシステムのボトルネックになります。
- 提案手法
- MR-TopoMap:通信制限環境におけるトポロジカルマップに基づくマルチロボット探索
- 新規性
- トポロジカルマップに基づくマルチロボット探索フレームワークにより、ロボット間の通信トラフィックを削減する。
- 作成したトポロジカルマップに基づく探索戦略により、探索効率を向上させる
- コード
- 公開なし
LCDNet: Deep Loop Closure Detection and Point Cloud Registration for LiDAR SLAM (I)
- 論文
- 課題
- ループクロージャ検出は、同時ローカリゼーションおよびマッピング(SLAM)システムの重要なコンポーネントであり、時間の経過とともに蓄積されるドリフトを低減します。
- 何年にもわたって、このタスクに対処するためにいくつかのディープラーニングアプローチが提案されてきましたが、特にリバースループを処理する場合、それらのパフォーマンスは手作りの手法と比較して標準以下でした。
- 提案手法
- LCDNet
- LiDAR SLAMのディープループクロージャ検出と点群登録
- LCDNet
- 新規性
- 逆ループを効果的に検出するループクロージャー検出のための新しいアプローチであるLCDNetを提案する
- アンバランス最適輸送理論に基づき、部分的にしか重ならない2つの点群や任意の初期位置ずれを登録できるエンドツーエンドの学習可能な相対姿勢回帰ネットワークを提案する
- 既存のループクロージャー検出手法を統一的な評価プロトコルで総合的に評価し、LCDNetを複数の自律走行データセットで広範囲に評価し、我々の貢献が有効であることを示す詳細なアブレーションスタディを提示する
- コード
Anchor Selection for SLAM Based on Graph Topology and Sub-Modular Optimization (I)
- 論文
- 課題
- 従来のSLAMフレームワークでは、ロボットの姿勢と周辺地図は、ワールド座標フレームの原点とみなされるロボットの開始位置を基準として推定されるのが一般的です。
- しかしロボットが原点から遠ざかるにつれてセンサーの精度、ループ閉鎖の頻度、軌道の長さなどに依存する割合で推定誤差が蓄積される。
- アンカーと呼ぶいくつかのポーズの真理値が利用可能であれば、アンカーと原点間の「ゼロ不確実性」ループ閉鎖を導入するのと同様の直感的な利点があるため、推定パラメータの精度は有意に改善される。
- アンカーの数や配置は、SLAMフレームワークの推定精度に影響を与えることは明らかである。
- アンカーによる外部計測は、多くの場合、多大な手動操作(ETSシステムの適用など)、高コスト(基地局の建設など)、本来のタスクへの影響(GPS fixを達成するために、ある場所で長時間停止するなど)を必要とする。
- そのため、推定精度を維持したままできるだけアンカーの数を減らすことが望ましい。
- 提案手法
- グラフトポロジーとサブモジュラー最適化に基づくSLAMのためのアンカー選択
- 新規性
- グラフトポロジー
- D-最適化指標に基づくアンカー選択問題から、重み付きラプラシアン行列の部分行列選択に近似することで、その計算量を大幅に削減し、計算機的に解けるようにする。
- サブモジュラー
- サブマトリクス選択問題の非負、非正規化、非単調のサブモジュラー特性を証明したものである。
- 解法
- 遅延評価,コレスキー分解,近似ミニマム次数順列(AMDP),次数再利用,ランク1更新の手法を用いた貪欲ベースの効率的な手法で,通常の貪欲手法に比べて優れた実行時間能力を達成する.
- グラフトポロジー
- コード
- 公開なし
SLAM7
Simultaneous Localization and Mapping through the Lens of Nonlinear Optimization
- 論文
- 課題
- SLAMアルゴリズムは、視覚・慣性推定をフィルタリングまたはバッチ最適化手法で行う。
- 経験的にフィルタリングアルゴリズムは計算が速く、最適化法はより正確であることが示唆されている。
- しかし、統一されたフレームワークが存在しないため経験的な知見の分析ができない。
- 提案手法
- 既存のSLAMアルゴリズムの大規模なクラスを包含するSLAMバックエンドのための統一された最適化ベースのフレームワークを定式化
- 新規性
- このフレームワークを使用して、拡張カルマンフィルタ(EKF)、マルチステート拘束カルマンフィルタ(MSCKF)、およびオープンキーフレームビジュアル慣性SLAMアルゴリズム(OKVIS)を最適化ベースのバックエンドアルゴリズムとして再構成し、再構成したMSCKFの経験的性能を、Open Keyframe Visual- Inertial SLAM[12]のキーフレームに基づくアプローチなどのスライドウィンドウ最適化に基づくバックエンドアルゴリズムと比較しています。
- コード
- 公開なし
Fast and Safe Exploration via Adaptive Semantic Perception in Outdoor Environments
- 論文
- 公開なし
- 課題
- 未知環境における自律的な探索は、ロボットにとって基本的なタスクである。
- しかし、視覚的SLAMでは姿勢推定のドリフトが頻繁に発生し、ロボットの位置特定や探索の性能に悪影響を及ぼす。
- 提案手法
- 知覚認識探索(PAE)手法
- perception-aware exploration
- 知覚認識探索(PAE)手法
- 新規性
- ローカライゼーションの不確実性を頑健かつ安定的に表現するために、適応的意味知覚法を提案し、安定した意味情報と特徴点情報を組み合わせることで、人工的な経験に頼らないローカライゼーションの実現を目指している。
- 適応的なセマンティック情報に対して知覚的な重み付き係数を生成し、探索における位置の安全性を保証するために重み付き情報利得を設計する。
- 探索の効率性と走行軌跡の連続性を向上させるパイプラインを提案する。
- 探索目標までの軌道に沿った定位不確実性を確保するために、知覚情報に基づくリアルタイム連続経路計画モジュールを移動ロボットに開発した。
- 視覚的SLAMフィードバックに基づく軌道追跡には、モデル予測制御が利用される。
- コード
- 公開なし
Towards Robust Visual-Inertial Odometry with Multiple Non-Overlapping Monocular Cameras
- 論文
- 課題
- 現在の単眼およびステレオVIOアルゴリズムは、ほとんどの公開データセットにおいて、状態推定に高い精度と安定性を達成している
- しかし、これらのVIOアルゴリズムの頑健性の向上は、依然として重要な問題である。
- 公共データセットに含まれる限られたシナリオとモーションパターンにより、このような安定性は信頼できない。
- 現在のVIOアルゴリズムは、均質なテクスチャ、一貫性のない照明、攻撃的な動きなど、特定の環境において失敗しがちである。
- この問題を考慮し、複数のカメラを使用してロバスト性を高める方法が数多く提案されている。
- しかし、追加のカメラを導入すると、CPU の計算量が増えてしまいます。
- 提案手法
- 複数のオーバーラップしない単眼カメラを備えた視覚慣性オドメトリ(VIO)アルゴリズム
- 新規性
- 複数の非重複単眼カメラを用いたVIOアルゴリズムを提案する。
- 複数のカメラで観測された安定した特徴をバックエンドに送り込み最適化することで、より高い初期化成功率とよりロバストな状態推定を実現する。
- マルチカメラVIOの効率性を向上させるため、NVIDIA Vision Programming Interface(VPI)を用いてフロントエンドの特徴抽出と追跡をGPU上で設計・設定し、比較的低いCPUリソースでマルチカメラデータを処理できるようにする。
- 複数の非重複単眼カメラを用いたVIOアルゴリズムを提案する。
- コード
Scalable probabilistic gas distribution mapping using Gaussian belief propagation
- 論文
- 課題
- 化学、生物、放射線、核(CBRN)シナリオで活動するモバイルロボットにとって、環境に関する情報をできるだけ多く収集することは重要な指令です。
- ガス分布マッピング(GDM)アルゴリズムは、周囲の測定が可能なガス感応センサーを備えた移動ロボットを活用することで、過去20年にわたり開発されてきました。
- 移動ロボットに特化したGDMに用いられるデータ駆動型手法にガウスマルコフランダムフィールド(GMRF)と呼ばれる手法がある。
- このモデルは測定値の時間的減衰と、与えられたセルでのモデル化された濃度に対する障害物の影響を確率的に説明できるという利点があるが、計算コストが高いという課題がった。
- 提案手法
- GaBP(Gaussian belief propagation)
- 新規性
- GaBPをファクターグラフベースのGDMのための高速かつ適切なソルバーとして統合
- 収束した解を維持しながら、新しい濃度測定をGaBPソルバーに繰り返し追加する方法を示し、オンライン逐次GDMの効率を大幅に向上させました。
- これまで文献に明示的に定義されていなかった、通過したメッセージ間の差分を計算するための距離メトリックを定義しています。
- コード
- 公開なし
WiSARD: A Labeled Visual and Thermal Image Dataset for Wilderness Search and Rescue
- 論文
- WiSARD公式サイトhttps://sites.google.com/uw.edu/wisard/
- 課題
- センサーを搭載した無人航空機(UAV)は、荒野で失われた人を見つけて救助するプロセスである荒野捜索救助(WiSAR)作戦を実行するファーストレスポンダーの捜索時間を短縮し、安全上のリスクを軽減するのに役立つ可能性があります。
- 残念ながら、視覚センサーだけでは、WiSAR操作を実行できるすべての可能な地形、天候、および照明条件にわたる堅牢性のニーズに対処することはできません。
- マルチモーダルセンサー、特に視覚サーマルカメラの使用は、WiSAR UAVがさまざまな動作条件で機能できるようにするために重要です。
- ただし、荒野のコンテキストによってもたらされる独自の課題のため、既存のデータセットベンチマークは、自律型WiSAR UAV用のビジョンベースのアルゴリズムを開発するには不十分です。
- 提案手法
- さまざまな地形、季節、天候、照明条件でのUAV飛行から収集された約56,000のラベル付き視覚的および熱的画像を含むデータセットの紹介
- 新規性
- 自律的なWiSAR運用のためにマルチモーダルセンサーで収集された最初の大規模データセット
- コード
A Tightly-Coupled Event-Inertial Odometry using Exponential Decay and Linear Preintegrated Measurements
- 論文
- 公開なし
- 課題
- イベントカメラは、従来のカメラとは異なり、高速モーション中やダイナミックレンジの高いシーンでセンサーデータを提供できます。
- グローバルシャッターレートで強度情報を提供するのではなく、ピクセル位置で明るさが変化したかどうかに応じて非同期的にイベントがトリガーされます。
- イベントベースVIOの多くの研究は、FASTコーナー検出器やKLTトラッカーなどの従来の画像技術に依然として依存しています。
- このような処理では例えば、攻撃的な動作における自我運動推定に必要な情報を見落とす可能性がある。
- 提案手法
- 指数関数的減衰と線形事前積分測定を用いた密結合イベント慣性オドメトリ
- 新規性
- Arc* Corner Detectorを用いてイベントコーナーを検出し、Linear Preintegrated Measurement (LPM)]として知られる再統合計測の連続形式を用いて密結合されたコーナートラックを形成し、運動仮定を省略して任意の時点の慣性観測のクエリーを可能にする。
- 空間的、時間的な局所性を使って関連付けられた純粋なイベントから形成されたトラックの使用を提案する。
- バッチ最適化フレームワークで非同期イベントと慣性計測を緊密に統合した完全なオドメトリとマッピングのパイプラインを提示します。
- コード
- 公開なし
Photometric Visual-Inertial Navigation With Uncertainty-Aware Ensembles
- 論文
- 課題
- 過去10年間、視覚-慣性航法に関する集中的な研究が行われてきました
- これまでの研究では、照合または最適化ベースの推定器による融合方法、トラッキングフロントエンドとマッピングバックエンドからなるプログラミングアーキテクチャ、視覚-慣性計測処理技術などが提案されています。
- 画像計測の定式化の仕方によって、幾何学的誤差(間接誤差)と測光誤差(直接誤差)のどちらかを最小化することができる。
- 前者の歴史は古く、特徴抽出、データの関連付けの解決、再投影誤差の最小化などが重要なステップとなる。
- 後者は、連続した画像間の強度のずれを測定する測光誤差を直接的に最小化するものである。
- しかし、測光誤差で形成されるコスト関数は姿勢や構造パラメータに対して非常に非凸である。
- その主な理由は、画像強度の非線形性である。
- このため最適な点に到達するためには初期点を非常に精度よく求める必要がある。
- 提案手法
- EnVIO(ensemble VIO)
- 不確かさを考慮したアンサンブルを用いた確率勾配と結合した測光VIOのフレームワーク
- EnVIO(ensemble VIO)
- 新規性
- 状態空間を行列Lie群にモデル化した反復型拡張カルマンフィルタ(EKF)に基づく測光VIOの枠組みを紹介する。
- また、状態空間は行列Lie群でモデル化されている。多くの視覚慣性航法システムは、繰り返し可能で顕著な特徴に固執するが、測光方式は低テクスチャシーンに対して本システムを堅牢にする。
- 提案するパイプラインにおいて、その射影の不確かさを考慮した最適な強度勾配を導き出し、これが悪い初期化に対する頑健性につながっている。
- 提案する画像勾配の有効性を示すため、徹底的なモンテカルロシミュレーションを提示する。
- 状態空間を行列Lie群にモデル化した反復型拡張カルマンフィルタ(EKF)に基づく測光VIOの枠組みを紹介する。
- コード
FAST-LIO2: Fast Direct LiDAR-inertial Odometry
- 論文
- 課題
- 以下のような理由から、限られた計算リソースで正確なオドメト推定と密なマップの生成することは依然として困難な課題。
- LiDARが生成する大量の点群
- 計算負荷を減らすための特徴点ベース手法の問題
- LiDAR点群が移動しながら取得さえる場合の歪み
- 遠距離ほど疎なデータになる
- 以下のような理由から、限られた計算リソースで正確なオドメト推定と密なマップの生成することは依然として困難な課題。
- 提案手法
- FAST-LIO2
- 既存手法FAST-LIOの拡張版
- FAST-LIO2
- 新規性
- FAST-LIOと比べて
- Ikd-Tree構造による点群マップに関わる計算の高速化
- FAST-LIOは地図構築の時間増大を防ぐため小さい環境(例. 数100m)でしか使えない。
- 特徴抽出なしで生の点群をそのままマップに登録
- LiDARの種類に影響されない(スピン、プリズムベース、MEMSベースなど)
- 特徴の少ない環境でよりロバストになる
- 特徴点抽出のためのパラメータ調整が必要ない
- Ikd-Tree構造による点群マップに関わる計算の高速化
- FAST-LIOと比べて
- 効果
- FAST-LIOと比べて大幅な高速化
- 既存の手法(LILI-OM, LIO-SAM, LINS)に対しても圧倒的に優位
- オドメトリ算出に関しては既存手法が有意な場面がある
- マッピングを含めるとFAST-LIO, FAST-LIO2が圧倒的に早い
- コード
- 参考
Rail Vehicle Localization and Mapping with LiDAR-Vision-Inertial-GNSS Fusion
- 論文
- 課題
- 鉄道の安全運行には、鉄道車両の正確な定位と長期的な鉄道環境の監視が極めて重要である。
- しかし、現在の測位システムは、線路脇に設置されているため、リアルタイムでの測位が困難であるばかりでなく、建設やメンテナンスに多大な投資が必要です。
- 近年のセンサ技術の進歩や鉄道信号の標準化により、車載センサの研究が盛んに行われている。
- 列車の状態を推定し、その間に周囲をマッピングするという枠組みで、同時定位マッピング(SLAM)は、鉄道車両の定位と環境モニタリングの問題に対する有望なアプローチです。
- しかし、鉄道車両へのSLAMの適用には、1) 長時間の拘束された動き、2) 繰り返しの特徴、3) 再訪問場所の欠如という問題がある。
- 提案手法
- RailLoMer-V
- 全地球航法衛星システム(GNSS)支援LiDAR視覚慣性スキーム
- RailLoMer-V
- 新規性
- LiDAR、IMU、鉄道車両車輪走行距離計、カメラ、GNSSをスライディングウィンドウベースのファクターグラフ定式化により緊密に融合するフレームワークを提案する。
- 実験結果から、本システムは大規模な鉄道環境に対して十分な精度を持ち、鉄道上の長時間の後方移動に対してロバストであることが示された。
- センサ計測の幾何学的情報を十分に活用し、抽出された線路と消失点からの平面拘束を利用して、システムの精度とロバスト性を向上させることができる
- これらの特徴は、繰り返し構造を持つ地区において、縦方向と回転方向の誤差を効果的に拘束することが証明された。
- 我々のフレームワークは、様々なスケール、天候、鉄道をカバーし、1年間かけて収集したデータで評価された。
- LiDAR、IMU、鉄道車両車輪走行距離計、カメラ、GNSSをスライディングウィンドウベースのファクターグラフ定式化により緊密に融合するフレームワークを提案する。
- コード
- 公開なし
SLAM8
Detecting Invalid Map Merges in Lifelong SLAM
- 論文
- 課題
- 生涯SLAMでは、誘拐などによる一時的な位置特定失敗にも対処しなければならない。
- このため、再ローカライゼーションが成功したらすぐに新しいマップを作成し、前のマップとマージすることで対応する。
- しかし、再ローカライゼーションは誤りを犯す可能性があるため、例えば知覚的なエイリアシングが原因で、このようなマージが無効であることが起こり得ます。
- 提案手法
- 生涯SLAMにおける無効なマップマージの検出
- 新規性
- 無効なマージをどのように検出するかについての理論的な検討。
- 無効なマージを高い精度で効率的に検出するための4つの具体的なアルゴリズム。
- グラフベースSLAMシステムにおいて、切断された複数のグラフを扱うためのモデル。
- グラフの結合と結合の取り消しのためのアルゴリズム。
- 参照地図に基づく評価スキームにより、人手による作業を最小化する。
- コード
- 公開なし
MD-SLAM: Multi-Cue Direct SLAM
- 論文
- 課題
- SLAM(Simultaneous Localization and Mapping)システムは、未知の環境でナビゲートする自律型ロボットの基本構成要素である。
- SLAMの実装は、モバイルプラットフォームで採用されるセンサモダリティに大きく依存する。
- コンピュータビジョンの分野ではSLAM問題に、直接法による取り組みが多数報告されるようになった。
- しかし、この手法はカメラ画像では成功しているが、3D LiDARでは垂直方向の分解能が低いため有効な手法ではないと考えられている。
- 提案手法
- MD-SLAM(Multi-cue Direct SLAM)
- 新規性
- 3Dデータ用の柔軟で直接的なSLAMパイプライン
- RGB-Dと3D LiDARデータを統一的に扱うことができる唯一のオープンソースSLAMシステム
- 従来研究であるマルチキューフォトメトリックレジストレーション手法を改良し、LiDARと同様にRGB-Dデータで動作するセンサの増分運動を計算する。
- バイナリサーチツリー(BST)構造とバイナリ特徴記述子を用いた外観ベースのループ検出アルゴリズム
- 既存フレームワーク上に実装したコンパクトな最適化問題処理コンポーネント
- ベンチマークデータセットを用いて、RGB-DとLiDARの両方のデータでテストされている。
- 3Dデータ用の柔軟で直接的なSLAMパイプライン
- コード
Visual-Inertial Multi-Instance Dynamic SLAM with Object-Level Relocalisation
- 論文
- 課題
- 視覚的なSLAMは、その精度、速度、低コストから注目を集めています。
- しかし、既存のSLAMシステムの多くは、グローバルな環境が時間を通して変化しない静的な世界を強く仮定しています。
- 動的環境におけるSLAMシステムのロバスト性を向上させるために、多くの著者が様々な解決策を提案しています。
- 中でもオブジェクトレベルで追跡とマッピングを行うオブジェクトSLAMは、静的なオブジェクトに対してカメラのポーズをロバストに測定することができます。
- しかし、ほとんどのオブジェクトSLAMは動的オブジェクトが画面内の大部分を占めないなどの仮定を置く必要がある。
- このようなシステムでは、アイテムが消えて再び現れると、データの関連付けを構築して姿勢を回復することができず、結果としてオブジェクトモデルが重複してしまう。
- 提案手法
- オブジェクトレベルの再ローカライゼーションを伴う視覚・慣性マルチインスタンスダイナミックSLAM
- 新規性
- 密に結合した最初のRGB-D-InertialオブジェクトレベルマルチインスタンスダイナミックSLAMシステムである。
- カメラ視野内で消えたり、再び現れたりする移動物体を復元する物体再ローカライゼーション法を提案する。
- 小規模から部屋規模のダイナミックシーンで広範囲にシステムをテストして、提案する方法の有効性と堅牢性を実証しています。
- コード
- 公開なし
ACEFusion - Accelerated and Energy-Efficient Semantic 3D Reconstruction of Dynamic Scenes
- 論文
- 課題
- SLAMは、未知の環境、未知の場所に置かれた移動ロボットに対して、環境地図の作成と地図内でのロボットの位置特定を同時に行うシステムである。
- センサー、機械学習、コンピューティングの進歩により、SLAMは当初の範囲を超え、静的・動的環境の3D形状やその意味的側面までマッピングできるようにな った。
- 空間AIという概念は、SLAMを位置追跡の問題から拡張し、豊かな認知マップを構築するという、より広い問題を指すために最近作られたものである。
- しかし、リアルタイムに処理しようとすると協力なGPUが必要になる。
- 提案手法
- ACEFusion
- 新規性
- CPU上での静的セマンティック再構成にはオクツリーを、GPU上での動的再構成にはサーフェルを用いたハイブリッド表現。
- 画像処理パイプラインを専用アクセラレータ上で再構成タスクと並行して実行し、その結果を下流のタスクの強化に利用する。
- Nvidia Jetson AGX Xavier上でリアルタイムに実行されるシステム。
- 動的環境下での姿勢推定に関する最先端技術に匹敵する、またはそれ以上の結果。
- コード
- 公開なし
A Spanning Tree-Based Multi-Resolution Approach for Pose-Graph Optimization
- 論文
- 課題
- ロボットの軌道推定と環境地図の生成を同時に行う問題をSLAM(Simultaneous Localization and Mapping)問題と呼ぶ。
- SLAM問題には、地図の部分的・漸進的な更新を考える漸進的SLAMと、観測データの一括取得から地図全体の生成を考える完全SLAMに大別される。
- ポーズグラフの完全SLAM問題は、ポーズグラフSLAM問題またはポーズグラフ最適化(PGO)と呼ばれ、過去数十年にわたり活発な研究が行われてきました。
- しかし、ポーズグラフ最適化の理論的な複雑さは、線形複雑さよりも高次のものであることが判明しており、そのような大規模なポーズグラフに対して、直接スパースソルバー(例えばCHOLMOD)は非常に効率的であることが分かっています。
- 一方、移動ロボットに使用される環境地図の規模は、近い将来、着実に大きくなると予想されます。
- そのため、計算コストのさらなる向上が求められています。
- 提案手法
- 新しいスパニングツリーに基づく多重解像度階層に基づくポーズグラフ最適化手法
- 新規性
- 提案する多重解像度(MR)の定式化は、下位(密)レベルに属するノードの姿勢を、上位(疎)レベルに属する1つの上位ノードの姿勢を外挿することで、粗密変換を行う。
- コード
Situational Graphs for Robot Navigation in Structured Indoor Environments
- 論文
- 課題
- モバイルロボットは、周囲の状況を理解し、タスク指向の正確な周辺環境マップを推定し、その中に自己を定位させるために、シーンの重要な要素の豊富なセマンティック記述を必要とします。
- 最近のSLAMアプローチは、環境とその意味的要素を、要素間の構造的・位相的制約を伴う階層的表現で効率的に表現するために、シーンをグラフとしてモデル化しています。
- シーングラフを用いることで、ロボットは人間と同様に、高レベルの抽象的要素(椅子、テーブル、壁など)と、それらの間の相互接続(部屋や廊下を形成する一連の壁など)を用いて、環境を理解し、ナビゲートすることができる。
- シーングラフを用いた研究は有望であるが、シーングラフとロボットの姿勢を同時に最適化するSLAM手法との接続にはまだギャップがある。
- 提案手法
- S-Graphs(Situational Graph)
- 新規性
- ボットのオドメトリと3次元LiDAR計測を用いたS-Graphsのリアルタイム実装(3階層)
- 室内シーンの高レベルな表現を可能にし、平面ランドマークとロボットポーズを制約する、新しい部屋と廊下の要素をグラフの定式化に導入
- シミュレーションと実シナリオによる徹底的な実験評価により、表現上の利点に加え、我々のS-Graphモデルが最先端の精度を達成することを示す
- コード
- 公開なし
PFilter: Building Persistent Maps through Feature Filtering for Fast and Accurate LiDAR-Based SLAM
- 論文
- 課題
- レーザーセンサーを用いたSLAM(Simultaneous Localization and Mapping)は、移動ロボットや自律走行車に広く採用されている。
- これらのSLAMシステムでは、限られた計算資源で正確な位置特定をサポートすることが求められています。
- 特に、点群登録、すなわち、複数の場所で収集された複数のLiDARスキャンをグローバルな座標フレームワークでマッチング・整列させる処理は、SLAMのボトルネックステップとみなされている。
- 提案手法
- PFilter(P-index Filter)
- 新規性
- 特徴点の評価に新しい属性p-Indexを提案し、その点が永続的であるか一時的であるかを示す。
- PFilterをscan-to-map LOシステムに組み込み、KITTIデータセット[15]を用いて実験を行い、PFilterが効率と精度を同時に改善できることを実証
- コード
- 公開なし
Nested Sampling for Non-Gaussian Inference in SLAM Factor Graphs
- 論文
- 課題
- 移動ロボットの基本的な問題であるSLAM(Simultaneous Localization and Mapping)は、ロボットとランドマークの相対的な計測値から、ロボットとランドマークの状態の事後分布を推定することが一般的に提起されています。
- このような推論を行うことはSLAMの重要なステップである。
- SLAMの事後分布は一般に非ガウス分布だが事後推定は一般に困難であるため、実際の処理では決定論的または確率的に近似して処理される。
- 近似手法の中でも確率的近似アルゴリズムは一般に計算量が多いが、より表現力の高い推論解法として認識されている。
- その中でもネスティッドサンプリングは最近の確率的近似手法であり,多峰性分布のサンプリングに威力を発揮する。
- 提案手法
- NSFG(nested sampling for factor graphs)
- 新規性
- ネスティッドサンプリングとファクターグラフから得られる情報量豊富な事前分布を組み合わせた手法
- コード
City-Wide Street-To-Satellite Image Geolocalization of a Mobile Ground Agent
- 論文
- 課題
- 建物の高さによってGPS信号が遮断される都市の峡谷、ドロップアウト、ジャミング、スプーフィングなど、GPSが利用できない、または信頼できないシナリオは数多く存在します。
- GPSの補足として、正確なグローバルローカライゼーションを提供できるものがあれば、貧弱なGPSのカバレッジを強化したり、置き換えたりすることができるため、望ましい。
- この問題に対する有望なソリューションがGTAG(Ground-to-Aerial Geolocalization)であり、地上から見たカメラ画像を同じ場所の航空衛星画像とマッチングさせます
- GTAGはこのような画像照合だけで時間経過とともに正確な位置推定ができるため、GPSの問題を効果的に解決することができます。
- しかし、従来の研究ではり大きな衛星データベースと画像のマッチングが難しくなるため、限られた初期化で都市全体の正確な位置特定にスケールアップすることはできないという問題があった。
- 提案手法
- WAG(Wide-Area Geolocalization)
- 新規性
- 従来の手法で必要とされる高密度な衛星画像データベースの代わりに、より粗い衛星画像データベースを維持
- WAGが三項損失を用いた追加学習により、非中心衛星画像を強固に照合することで実現
- データベース全体からの最大衛星画像類似度を取り入れたガウス測定モデルを用いることで、粒子フィルタアルゴリズムを改良
- 類似度測定のノイズをより正確にモデル化できることが確認
- 従来の手法で必要とされる高密度な衛星画像データベースの代わりに、より粗い衛星画像データベースを維持
- コード
- 公開なし