YOLO9000 バンディングボックスの予測について
YOLO9000 バンディングボックスの予測について
現在YOLO9000の論文を読んでおります。
URL : https://arxiv.org/abs/1612.08242
バンディングバックスの予測の部分でお伺いしたいことがあります。
tx ty tw thはネットワークの出力でそれぞれバンディングボックスの中心座標、幅、高さを表している(学習データに正解値としてバンディングボックスの中心座標、幅、高さが保存されており、それに近い値となっている)解釈でいるのですが、その解釈で合っていますでしょうか。
その場合わざわざ、tx ty tw thを用いてbx by bw bhを算出している意図を把握しかねております。
tx ty tw thとbx by bw bh間の違いを踏まえてこの意図についてご回答いただけると幸いです。
0