空間信頼性について
どなたか下記の論文の図4を画像認識をすこしかじった程度の大学生にもわかるように説明して頂けないでしょうか?
どのようにして追跡すべき場所を判別しているのかがイマイチわかりません
「Discriminative Correlation Filter Tracker withChannel and Spatial Reliability」
URL:https://arxiv.org/pdf/1611.08461.pdf
どなたか下記の論文の図4を画像認識をすこしかじった程度の大学生にもわかるように説明して頂けないでしょうか?
どのようにして追跡すべき場所を判別しているのかがイマイチわかりません
「Discriminative Correlation Filter Tracker withChannel and Spatial Reliability」
URL:https://arxiv.org/pdf/1611.08461.pdf
付け焼刃ですが、Channel and Spatial Reliability Trackingを略してCSRTとよばれているようですね。検索にご利用ください。
さて、くだんの章のメインテーマである
spatial reliability map
についてですが、和訳するなら
空間的信頼度写像
となりそうです。図4で示していることの全容は理解していませんが、
Training region (学習?領域)
というのはここでは既に与えられたものとして話が進んでいるようです。
この領域(region)内で、追跡対象となるピクセル集合を見つける手段として、この章までに空間的信頼度写像なるものを導入しましたと(あるいは論文以前から既知とみなしますと)。
しかし、これは実際の映像データの一静止画(1フレーム画像)の指定された範囲から、実際の追跡対象(図4で言えば選手の顔にあたる)を見出す為に、いちいち細部を詰めて構成(constructing)しなくてはならないもののようです。
問題の章では、映像データと、その1フレーム画像と、その内部の「ここにあるものを追跡してほしい」という領域が指定されたときに、有効な空間的信頼度写像をどう構成するかという話を展開しています。
あとは、かじった知識と来るべき他の回答と論文既読部分の知識で何とかしてください。f・・
或いは学内で質問してもいいと思います。
大学教授とか言う生き物が、背伸びしてる学生に対して「そんなこともわからないのか」というような返しをすることはまずないはずなので、そこは信頼してあげてください。