1. 概要
車両の前方に取り付けた単眼カメラを使って自動運転向けの車線検知(Lane Detection)を3次元推定する技術は多く提案されているが、一般的には俯瞰画像を生成して検知する手法が取られる。一方、単眼カメラでは深度を考慮して俯瞰画像を作ることが難しいため、3次元的に車線を検知する際に正確に車線を推定することは難しかった。提案手法では車両前方を映した単眼カメラ画像から、3次元の地面の平面情報を繰り返し推定していくことで車線が3次元空間でどこに位置するか正確に推定できるようにした。
2. 新規性
この研究では、前方を撮影した単眼カメラからEnd-to-Endで三次元の車線検知を行う手法を提案しており、従来手法のように俯瞰ビューの特徴を挟まないことで高精度な推定を達成している。
3. 実現方法
トランスフォーマーを用いて、車線検知用のクエリと3Dの地面情報が含まれるキーをペアにして、クロスアテンションを用いて3次元空間で車線を推定する。ここで、各クエリは2次元空間で車線特徴(Lane Embedding)と座標情報(Point Embedding)を考慮して生成される。推定される3次元空間情報は反復的に更新されてデコーダーに反映されるため、精度向上に寄与している。
4. 結果
合成データセットApolloと実世界を撮影しOpenLaneおよびONCE-3DLanesのデータセットで、従来技術を大幅に上回るState-of-the-art(SOTA)の検出精度を達成した。
last updates: Oct 9 2023