個人的におもろいな~なと思った技術をまとめてみました。
Tracking Any Object Amodally
こちらのツイートをまず、見て頂きたいです。
すごくないですか...?従来のトラッキングは、何かに遮られてしまうと見失う、それが常識でした。それを覆す技術です。
日本語訳にすると、「あらゆる物体をアモーダルに追跡」です。アモーダルとは、物体の遮蔽された部分を補う視覚の補完機能のことです。
YOLO-World
自然言語とタックを組んだYOLOの派生のモデルです。
「なんとなくこれを検出したい」というのが実現できそうですね!
YOLOv9
言わずと知れたYOLOシリーズの最先端モデルです。
引用:https://github.com/WongKinYiu/yolov9
物体検出の分野は、常に高速かつ正確なモデルを求めて進化しています。YOLOシリーズはその最前線にあり、最新のYOLOv9は、前作YOLOv8と比較して、計算効率と精度の両方で顕著な改善を実現しました。
YOLOv9は、YOLOv8と比較して、パラメータの数を49%削減し、計算量を43%削減しながら、MS COCOデータセットにおけるAP(平均精度)を0.6%向上させました。これは、計算リソースが限られている環境でも高い性能を発揮することが可能であることを意味します。
YOLOv9の成功の背後には、二つの重要な技術、PGI(Path Gradient Injection)とGELAN(Gradient Enhancement Layer)があります。
YOLOv9は、高度な技術革新により、物体検出の精度と効率を同時に向上させることに成功しました。PGIとGELANの導入により、勾配の問題を克服し、より高速かつ正確な物体検出が可能になりました。YOLOv9は、物体検出技術の未来を形作る重要なステップです。
論文、Github