概要
YOLO Unraveled: A Clear Guideを読み解いていき、それぞれの違いや特徴を把握し、業務に活かせるレベルで知見を得る
YOLOの家系図(2024)
本家はJoseph RedmonのYOLOV1
ライセンスの観点
Understanding the license of a model is important. Models with licenses that allow commercial use are marked in green, and those that prohibit such use are marked in red. This knowledge is essential for developers to ensure that the use of the model is legally valid, especially for commercial purposes.
と記載があり、緑色は商用利用が可能らしい。が、記事の
画像で緑色のライセンス該当部分が見当たらず。
主要なフレームワークを表にしてみる。
model | year | license | url |
---|---|---|---|
YOLOX | 2021 | APACHE | https://github.com/Megvii-BaseDetection/YOLOX |
PP-YOLOE | 2022 | APACHE | https://github.com/Gaurav14cs17/YOLOE |
DAMO YOLO | 2023 | APACHE | https://github.com/tinyvision/DAMO-YOLO |
YOLO V6 | 2023 | GPL | https://github.com/meituan/YOLOv6 |
YOLO V7 | 2022 | GPL | https://github.com/WongKinYiu/yolov7 |
YOLO V8 | 2023 | AGPL | https://github.com/ultralytics/ultralytics |
YOLO NAS | 2023 | CUSTOM | https://github.com/Deci-AI/super-gradients |
YOLO系のCOCOの成績
10msで100FPSなので、30FPS目標値であればこの表に載っているモデルは全て問題なく使用できそうである。60FPS出したければAIモデル以外の処理速度を考えると6ms以下のモデルを選択する必要がありそう。DAMO-YOLOというのが精度的にはかなり良さそう。ライセンスもAPACHEであるし、かなり有用そう。次に良さそうなのは、YOLO V8。YOLO V8のライセンスに読解力を必要としており、一癖はありそうだけれども、商用利用はできるらしい。この表で1番芳しくなさそうなのがYOLO V5とYOLOX。これらは少し古いのかもしれない。
エッジデバイスでYOLOを使用する場合は、軽量なモデルが好まれる。INT8での精度を見てみると、YOLO-NAS-INT8系の成績がかなり良い。時点で黄色のYOLO V6 3.0の成績が良さそう。
YOLO-NASは2024-02-07時点ではAPACHE-2.0ライセンスと記載がありますが、LICENSEページがリンク切れを起こしているので使用する際は念のため確認する必要がありそう。
MMYOLOに掲載されているかどうか
mmyoloにてモデルが使える状態であれば、比較や実装の難易度が下がるが、DAMO YOLOやYOLO NASはopen-mmlabにて使える状態ではないので、個々のリポジトリから実装する必要がありそう。
model | year | license | MMYOLO |
---|---|---|---|
YOLOX | 2021 | APACHE | yes |
PP-YOLOE | 2022 | APACHE | yes |
DAMO YOLO | 2023 | APACHE | no |
YOLO V6 | 2023 | GPL | yes |
YOLO V7 | 2022 | GPL | yes |
YOLO V8 | 2023 | AGPL | yes |
YOLO NAS | 2023 | CUSTOM | no |
結論
- 現時点でライセンス的にはDAMO-YOLO、YOLO V8が良さそう
- YOLOXは若干古くなってきており、モデルのアップデートを検討しても良い時期らしい
- YOLO V6も良さそうだけれどもライセンスがGPLなので商用利用はネガティブ
- エッジデバイスで使用する場合は、YOLO-NAS(ライセンス要確認)やYOLO V8などが良さそう
- COCOの成績やLatencyだけではなく、個々のモデルの学習手法やネットワーク構造をもう少し深めていく必要あり