目的
ここに記載するのは、すごくわずかな情報です。
「Tiny YOLO」とか「YOLO Tiny」という言葉を聞くことがあるが、ご存じのとおり、一種類でないです。
念のため、本家darknetの記載を確認した。
「Tiny YOLO」と「YOLOv3-tiny」
おそらく、本家の開発者は、それほど、言葉を使い分けているわけではないと思うが、
darknetのサイトでの記載では、以下のようになっている。
(出典: https://pjreddie.com/darknet/yolo/ )

↑↑ 上記にあるように、少なくとも2つある。YOLOv2でのtinyと、YOLOv3でのtiny。
前者が「Tiny YOLO」、後者が「YOLOv3-tiny」という名称で記載されている。
これは、ここで、そう書き違えているだけかも???(こだわりがあるとは思えない。)
モデル | Convolutionのレイヤ数 | 備考 |
---|---|---|
YOLOv2 | 18 | ※1 |
Tiny YOLO | 7 | ※1 |
YOLOv3 | 52 | ※1 |
YOLOv3-tiny | 7 | ※1 |
※1 資料上は、もう1層多いことになっている。cfgファイルで数えるとこの表の数字になる。 | ||
数え方を1つ、ワタシが間違えている可能性大。 |
まとめ
「Tiny YOLO」と「YOLOv3-tiny」、少なくともtinyものが2つある。
いずれのtinyも、Convolutionのレイヤ数が、かなり少ないです。
逆に、YOLOv3のConvolutionのレイヤ数はかなり多いです(50以上)。
この項までの記載でわかっていなかったこと *
(*この項は、すべて、2020/4/6以降の追記)
・「数え方を1つ、ワタシが間違えている可能性大」(上記抜粋)
⇒どうも、**(全)結合層とかも数えるのが、**普通だということがわかっていなかったよう。
・darknet-53が意味する範囲と、yolov3等のyolov3全体が意味する範囲がわかっていなかったよう。
darknet-53の層数の数え方 *
(*この項は、すべて、2020/4/6以降の追記)
論文の図の右側に、赤い文字で、層数を数えた結果を示す。
Convolutional 52層に、結合層1層で、計53層。
引用元:https://pjreddie.com/media/files/papers/YOLOv3.pdf
darknet-53とyolov3の違い *
(*この項は、すべて、2020/4/6以降の追記)
darknet-53自体は、通常の物体認識のネットワークになっているのでは?
yolov3という場合には、下図のように、darknet-53をベースとして、もう少し、ごちゃごちゃした
ネットワークがついている。
(引用元:https://towardsdatascience.com/yolo-v3-object-detection-53fb7d3bfe6b)
※↑ yolov3などの論文には、このようなわかりやすいネットワークの図はありません。
関連論文 *
(*この項は、すべて、2020/4/6以降の追記)
https://arxiv.org/pdf/1506.02640.pdf
https://pjreddie.com/media/files/papers/YOLOv3.pdf
関連(本人)
良書 「GPUを支える技術 超並列ハードウェアの快進撃[技術基礎]」を読む
文献『From Model to FPGA: Software-Hardware Co-Design for Efficient Neural Network Acceleration』を読む
今後
適宜、情報を足します。
コメントなどあれば、お願いします。