論文
論文名
Human pose estimation using deep consensus voting
著者
Ita Lifshitz, Ethan Fetaya, and Shimon Ullman
学会
ECCV2016
概要
人物姿勢推定に興味があることは変わりないが、画像内で人物と評価された領域での各位置がキーポイントらしいところに投票をするという新しい手法。このアプローチは画像全体からの情報を用いることができ、画像依存のキーポイント結合確率を得る。複数のデータセットにおいて競争力のある精度を示す。
結合確率:同時確率
コンセンサス投票:??
貢献
- キーポイント’投票’に対して深層畳み込みニューラルネットワークを適用
- キーポイント投票法という画像依存により複数のキーポイントに寄与することができる信頼度の高いアプローチを提案
- 複数のデータセットにおいて最先端手法に匹敵する精度達成
- キーポイントのローカライズにL2損失を用いるのではなくlog-polar binsを用いる(?)
- 複数の投票を高速に集約するための畳込み適用(?)
Ita Lifshitz, Ethan Fetaya, and Shimon Ullman. Human pose estimation using deep consensus voting. In ECCV, pages 246–260, 2016.
log-polar:??
評価
- MPⅡデータセットにおいて、最先端手法と張り合えている
- LSPデータセットにおいて、最先端手法と張り合えている
Ita Lifshitz, Ethan Fetaya, and Shimon Ullman. Human pose estimation using deep consensus voting. In ECCV, pages 246–260, 2016.
LSP:様々なスポーツをしている人の画像2000枚、訓練1000枚、テスト1000枚。14個のキーポイント。
PCP:四肢の検出を測定する指標。四肢の予測座標と正解座標のユークリッド距離が四肢の長さの半分以内であれば検出成功とみなす。値は検出率(であろう)。