論文
論文名
Differentiable Hierarchical Graph Grouping for Multi-Person Pose Estimation
著者
Sheng Jin, Wentao Liu, Enze Xie, Wenhai Wang, Chen Qian, Wanli Ouyang, and Ping Luo
学会
ECCV2020
概要
多人数姿勢推定のためのキーポイントグルーピングに興味がある。ボトムアップ方式の姿勢推定は効率的ではあるが、キーポイント検出とそのグルーピングは別々に解決されることが多く、最適化されていない。そこで、人物のパーツグルーピングをグラフクラスタリングタスクとして再定式化し、HGG(Differentiable Hierarchical Graph Grouping)を提案。HGGはキーポイント検出ネットワークとエンドツーエンドで学習可能であり、キーポイント候補を多層グラフニューラルネットワークを用いてクラスタリングする。また、クラスタリングの性能向上を図ってエッジ識別器とマクロノード識別器を新たに提案。主流なボトムアップ手法に簡単に組み込むことができ、複数のデータセット(COCO, OCHuman)において性能を向上させることを確認。
>Sheng Jin, Wentao Liu, Enze Xie, Wenhai Wang, Chen Qian, Wanli Ouyang, and Ping Luo. Differentiable hierarchical graph grouping for multi-person pose estimation. In ECCV, pages 718–734, 2020.貢献
-
多人数姿勢推定タスクをグラフクラスタリングとして定式化し、ボトムアップ方式においてグルーピング監視可能なエンドツーエンドのフレームワークを初めて提案
-
ローカル(近い距離?)およびグローバル(遠い距離?)なペアワイズ関係の特徴を学習し、グループ化の精度を高めるエッジ識別器とマクロノード識別器を提案
-
COCOにおいて最先端性能と同等、OCHumanにおいてSOTA
評価
- MS COCO:性能向上?
- OCHuman : SOTA
Sheng Jin, Wentao Liu, Enze Xie, Wenhai Wang, Chen Qian, Wanli Ouyang, and Ping Luo. Differentiable hierarchical graph grouping for multi-person pose estimation. In ECCV, pages 718–734, 2020.
OCHuman: 難易度の高い人物姿勢推定データセット。訓練データはなく、人物姿勢推定の精度限界を調査するためのもの
課題
多物体追跡やインスタンスセグメンテーションへの応用