2yuu
@2yuu (2Yu)

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

YOLO9000 バンディングボックスの予測について

YOLO9000 バンディングボックスの予測について

現在YOLO9000の論文を読んでおります。
URL : https://arxiv.org/abs/1612.08242

バンディングバックスの予測の部分でお伺いしたいことがあります。
tx ty tw thはネットワークの出力でそれぞれバンディングボックスの中心座標、幅、高さを表している(学習データに正解値としてバンディングボックスの中心座標、幅、高さが保存されており、それに近い値となっている)解釈でいるのですが、その解釈で合っていますでしょうか。

その場合わざわざ、tx ty tw thを用いてbx by bw bhを算出している意図を把握しかねております。
tx ty tw thとbx by bw bh間の違いを踏まえてこの意図についてご回答いただけると幸いです。

キャプチャ.PNG

0

1Answer

これ解決できたんですか?少し論文を読んでみたんですが、予測されているtx, ty, tw, th, toはセルの座標をベースにして、bx by bw bhは全体座標に変換しているように見えました。

0Like

Your answer might help someone💌