1. 概要
複数物体のトラッキングを行う際に、教師データとしてBounding Boxの矩形情報だけを使って、個別のIDを予測しトラッキングを実現する研究。従来手法では、矩形情報に加えて個別のID番号をペアで学習に用いることが多かったが、アノテーションコストがかさみデータ構築が大変だった。矩形情報だけからトラッキングできるようになったことで、高精度な物体検出器と組み合わせることで、アノテーション不要で自動の物体検出とトラッキングができる。この研究では、特に物体の見え方がフレーム毎に異なる不確実性を考慮している。
2. 新規性
教師なしで複数物体のトラッキングを行う手法を提案している。教師なし学習では不確実性(Uncertainty)が避けられないが、提案手法では、1)学習された不正確な関連付けを認識するアルゴリズム、2)適切なデータオーギュメンテーションの自動生成、をそれぞれ提案している。
3. 実現方法
フレーム間の物体それぞれについてどれが同一の物体か関連性を求め、不確実なペアを計算する。次に、不確実性の残る関連性を持つペアを修正し、フレーム間で修正されたラベル情報を伝播させる。
不確実性の高い物体とその特徴量に対して、頑健性を向上させるようにオーギュメンテーションを行う。
オーギュメンテーションされた特徴と修正されたペア情報をContrastive Learning(対照学習)を用いて分類する。
4. 結果
MOT17の学習データセットで検証してみると、67%不確実なペアが”不確かな”領域に分類され、99%の正しいペアの関連付けが”確かな”領域に分類されている。また、従来手法ではトラッキングの時間が増えると急激に精度が劣化していたが、提案手法は一貫して高い精度を保てていることが分かる。
従来手法と比較してもトラッキング性能が向上していることが分かる。
last updates: Nov 24 2023