[論文備忘録] Panoptic Quality (Panoptic Segmentation), 2018 #機械学習

semantic segmentation (stuff)とinstance segmentation (things)を統合したpanoptic segmentationを提案。

タスクフォーマット

各ピクセルiにsemantic class (l_i)とinstance id (z_i)をマップする:

z_iは同じsemantic classのピクセルを個別のセグメント(segment)にグループする。
曖昧もしくはクラスに属さないピクセルにはvoid labelがアサインできる。（e.g. すべてのピクセルがsemantic labelを持つとは限らない）

semantic classはstuffとthingsに大別される:

かつ

また、stuffではz_iの値は無視される。

Panoptic Quality

panoptic segmentationの評価尺度。
ground truthに対するpredicted panoptic segmentationのqualityを評価する。

1. Segment matching

predicted segmentはground truth segmentに対してintersection over union (IoU)が0.5より大きいときにマッチできる。（注: マッチするにはsemantic classが一致する必要もある）
これはpanoptic segmentationのnon-overlapping propertyな特性と併せてunique matchingを与える。（各ground truth segmentにつき、せいぜい1つのpredicted segmentがマッチする）

2. PQ Computation

次のようにPQをクラスごとに独立して計算し、その平均をとったものを評価値とする。

true positive (TP): マッチしたセグメントのペア
false positive (FP): マッチしなかったpredictedセグメント
false negative (FN): マッチしなかったground truthセグメント

0.5|FP|と0.5|FN|がペナルティとして分母に加えられていて、それを除いたものはマッチしたセグメントのIoUの平均値。

Note: すべてのセグメントはそのエリアに関わらず同じ重要度を持つ。

また、PQは次のようにsegmentation quality(SQ)とrecognition quality(RQ)を掛けたものとみなすこともできる: