1. 概要
自動運転の実現には、認識→予測→計画というそれぞれのタスクを解くことがが必要とされるが、既存手法ではそれぞれのタスクに独立したAIモデルの提案に留まっていた。この研究では、走行計画を実現するために必要な認識機能と予測機能の優先順位付けを行い、自動運転用の大規模公開データセットで効果を検証した。
*Award Candidate: BEST PAPER AWARD
2. 新規性
画像を入力とした類似研究に比べて、最も精度の高い技術を提案している。LiDARなどのレーダー機器を使った場合よりも走行計画のタスクで精度がよく、より安価なカメラで安全な走行計画が実現できることを実証した。
また、MotionFormer/OccFormer/Plannerというトランスフォーマーベースのネットワークを提案しており、自車の周囲の物体がどういう軌跡をたどるのかを予測し、見えなくなっても補完できるようにしており、安全な走行計画が立てられるようにしている。
3. 実現方法
安全な走行計画を実現するための機能として、物体のトラッキング(TrackFormer:MOTR,ECCV2022)、物体間の動き情報(Motion Former:this paper)、シーン全体の走行可能なエリアの検知(OccupancyFormer:this paper)、シーン全体の地図構築(MapFormer:Panoptic SegFormer,CVPR2022)のそれぞれをトランスフォーマーベースのモデルにより求める。ここで、トランスフォーマーのキー(K)とバリュー(V)が各ネットワークでシェアされ、全体のプランニングの最適化が図られる(Planner:this paper)。これにより、各モジュールの利点を最大限生かしつつシーン全体の視点から周囲の物体の移動状況を高次元空間で学習できるようになった。
4. 結果
データ数が多く難易度の高いnuScenesデータセットを用いて実験をしており、従来手法を上回る精度を達成した。
last updates: July 6 2023