はじめに
本記事では、WindowsにおいてLabelImgでYOLO形式のアノテーションを行なう場合、最も簡単な方法を解説します。
最終的に、YOLOカスタムモデルをRaspberry Piでデプロイする方法を解説します。シリーズでご覧いただけると嬉しいです。
(目指す最終イメージ)
本記事で獲得できるスキル
・画像のアノテーション
・AIモデル作成のための画像のデータセットの作成
参考記事
次の記事を参考にしています。感謝致します。
https://axross-recipe.com/recipes/1190
「公開日:2023/08/16更新日:2023/12/26
ラズベリーパイでYOLOv8オリジナル学習モデルの小型化およびEdgeTPUを利用して推論速度を向上させる/Shu」
LabelImgでアノテーションを行なう利点
・Datasetsの秘匿性を守れる(Label Studioではブラウザでの操作となり、Datasetsをブラウザ上にアップロードする必要がある)
・ラベル付けの操作が容易
・ローカルで作業するので、labelファイルをリアルタイムでローカルに保存できる。
等
環境
Windows 11 Home
LabelImg
手順
1)次のURLよりwindows_v1.8.1.zip をダウンロード
※This repository was archived by the owner on Feb 29, 2024. It is now read-only.
との記載がありますが、ダウンロードは可能で、解凍後のアプリケーションも利用可能です。
2)ダウンロードしたファイルを任意のフォルダに解凍
例:今回の解凍ディレクトリパスは以下の通りです。
C:\tool\windows_v1.8.1
3)「labelImg」をクリック
アノテーションを行なう時は、下記の画像において赤枠で示したアイコンの「labelImg」をクリックするのみです。
4)作業フォルダを作成し、画像データを格納
作業フォルダに画像データを格納すればOKです。筆者は、クラス毎に画像データを分けて保存していますが、1つのフォルダに全てのデータを格納してもアノテーションは可能です。
例:ここでは7つのクラスを定義しました。
7クラス×40枚=計280枚の画像データセットとなっています。
※尚、様々なやり方があると思いますが、画像データは全体で1~整数の連番を付与したファイル名で保存することをオススメします。
つまり、筆者の場合は全280枚の画像データに対し、それぞれ1~280のファイル名で保存しています。これにより、データセットのボリュームが一目で分かり、データの抜け漏れも発見しやすくなります。
5)アノテーションのためのセッティング
・View>Auto Save modeを有効化
・出力形式をYOLOに変更
※デフォルトで [PascalVOC] となっているボタンをクリックすることで変更します。
・ショートカットの確認
枠の作成を開始する:w
次の画像へ(Next Image):d
前の画像へ(Prev Image):a
・ディレクトリの指定
Open Dir:アノテーションをする画像データが格納されてるディレクトリを指定する。
Change Save Dir:アノテーションによって生成されるラベルデータの保存先ディレクトリを指定する。
※ラベルデータの格納先について
筆者は、のちに正しくアノテーションできているか、ラベルデータの内容(画像に付与したクラスID)を確認してから次の作業を行なっています。そのため、クラス毎にラベルデータを保管していますが、例えば、"All_labels"というフォルダを作成し、そこに全てのラベルデータを格納してもOKです。
6) アノテーションを行なう
Creat¥nRectBoxをクリックし、オブジェクトを囲う。
7)ラベルを記述あるいは選択
新規のラベルの場合は、赤枠の箇所でラベルを記述し、OKで進む。
既出のラベルの場合は、黄色枠の項目より該当のラベルを選択し、OKで進む。
クラスIDがラベルを登録した順に0より始まる整数の連番で付与されます。
あらかじめ、ラベルを定義することも可能
LabelImgを解凍したディレクトリに戻り、「data」ファルダを開くと、「predefined_classes」というファイルがあり、このファイルを訂正します。
例:predefined_classes.txtの格納されているパス
C:\tool\windows_v1.8.1\data\predefined_classes.txt
次の様に、テキストファイルを変更します。
クラスIDが上から順に0より始まる整数の連番で付与されます。
8)アノテーションによって生成されたラベルデータ内容を確認
アノテーションによって生成されるラベルテキストデータは次の通りです。
<class_id> <x_center> <y_center> <width> <height>
チェックすべきポイント
・自身で定義したクラスIDが正しく付与されているか
・バウンディングボックスの座標が正しいか
全てのアノテーションが完了すると、次の様なイメージになります。
▼例:クラスID:5(ラベル:stop)の画像データとラベルテキストデータ
おわりに
WindowsにおいてLabelImgでYOLO形式のアノテーションを行なう最も簡単な方法は以上の通りです。最初は、Ubuntu LinuxにおいてPython 3 + Qt5のインストールしたり、WindowsでPython、PyQt5、lxmlをインストールする方法等を実行しましたが、全ての依存関係をクリアするのが手間でした。様々な方法を試し、最も簡単なLabelImgの始め方は本記事の方法でした。
ちなみに、"LabelImg"は、現在開発が中止され、"Label Studio"コミュニティに統合されています。ですが、私は"Label Studio"よりも"LabelImg"の方が直感的に利用でき、自由でシンプルなので好きです。
Ultralytics社もデータラベリングはLabelImgの利用を推奨しています。
※https://www.ultralytics.com/ja/blog/exploring-data-labeling-for-computer-vision-projects
(Ultralytics社公開ドキュメント2025年5月8日閲覧)
アノテーションをするということは、自身でモデルを作成することに繋がります。よって、アノテーションツールに求めることはアノテーションのみで、ラベル管理やファイル操作、様々な管理はこちらで自由にやりたいのです。
しかし、度々LabelImgでアノテーションを行なう際に不具合が起こるため、備忘録として本記事を残します。
最後までご覧いただきありがとうございました。
次回
少ないデータセットでも何倍にもデータの拡張が可能です。次回は例として、10倍のデータセット拡張の方法とモデルの学習方法をご紹介します。お楽しみに❣
[YOLOカスタムモデルをRaspberry Piでデプロイ②]データセットをデータ拡張(Albumentation)する方法[超簡単]
https://qiita.com/LatanKee/items/58c3d5db1a601c513146