はじめに
Microsoft が公開しているアノテーションツール VoTT について、備忘録を兼ねて使い方を整理しました。
クラウドストレージを活用するオンライン版もあるようですが、今回はローカルファイルでのアノテーションを対象にしています。
アノテーションとは
直訳すると「注釈」と表現されることが多いですが、本記事では「機械学習の学習データ用に、画像にタグ付けを行う作業」を指します。
環境
- macOS Big Sur 11.4
- Microsoft VoTT 2.2.0
インストール
-
GitHub の releasesからのインストールが recommended らしいので、その通りに進めていく
準備作業
VoTTでは学習データのまとまりを「プロジェクト」として管理します。
「プロジェクト」には作業対象となるフォルダやクラウドサービスを指定する必要があり、これを
「接続(コネクション)」と呼びます。
アノテーション作業に入る前の事前準備として、この「接続」と「プロジェクト」を作成します。
接続(コネクション)の作成
VoTT でのアノテーション作業にあたり、必要なのは以下 2 つの接続です。
- ソース:アノテーション対象の画像や動画が保存されたフォルダ
- ターゲット:作成されたアノテーション情報をエクスポートするためのフォルダ
今回は以下の 2 つのコネクションを作ります。
- ソースフォルダ :annotation-source
- ターゲットフォルダ:annotation-target
-
今回作成した接続は以下の2つ
プロジェクトの作成
接続が準備できたら、プロジェクトを作成します。
-
プロジェクト情報を入力
今回は以下のように設定
- 表示名
Annotation Example
- セキュリティトークン
<Generate New Security Token>を選択
- ソース接続
<前項で作成したannotation-source>を選択
- ターゲット接続
<前項で作成したannotation-target>を選択
- 説明
アノテーションデータ作成の例
- ビデオ設定
- フレーム抽出率
15
- フレーム抽出率
- タグ
<空のまま(後で作成する)>
- 表示名
-
一通り入力したら「プロジェクトを保存」ボタンを押して作成完了
タグエディター画面の見方
メイン画面(タグエディター)は以下のような構成になっています。
-
メニュー選択
上から順に説明
- Home(プロジェクト選択)
- タグ エディター(上のスクリーンショットの画面)
- プロジェクト設定
- エクスポート(出力設定)
- アクティブラーニング(学習済みモデルによる自動タグ付けの設定)
- 接続(接続設定)
-
画像選択
ソースに指定したディレクトリ内の画像が一覧表示されます1。
閲覧済み(一度でもエディタ上で表示した画像)にはオレンジの目のアイコンが付きます。
また、タグ付が付与された画像には緑色のタグアイコンが付きます。 -
操作アイコン
- 選択(何も描画せず、描画済みの領域を選択する)
- 長方形を描く
- ポリゴンを描く
- 長方形をコピー
- アクティブラーニング実行
- 領域をコピー
- 領域をカット
- 領域を貼り付け
- 全てのリージョン(領域)を削除
- 前のアセット(画像/動画)
- 次のアセット(画像/動画)
- プロジェクトの保存
- エクスポート
-
アセット
アノテーション対象の画像が表示されます。
このエリアに長方形またはポリゴンを描画して、タグを追加していきます。 -
タグ
- タグの追加
- タグの絞り込み(タグの種類が多い場合に使用)
- 選択中のタグのロック(ロックしたタグが領域作成時に自動で割り当てられます)
- 選択中のタグの修正
- 選択中のタグの並べ替え(上に移動)
- 選択中のタグの並べ替え(下に移動)
- 選択中のタグの削除2
アノテーション
いよいよアノテーションを始めていきます。
基本的には以下の作業の繰り返しです。
「領域を選択」→「タグ付け」の作業を、全ての画像に対して繰り返します。
学習用データのエクスポート
-
左メニューの「エクスポート」を開いて設定を行う
- プロバイダー
Pascal VOC
- アセットの状態
<訪問済みのアセットのみ>を選択
- テスト/トレーニング分割
100(分割しない)
- 未割り当てをエクスポート
<チェックなし>
- プロバイダー
-
ターゲットに指定したフォルダに「vott-json-export」というフォルダが作成され、その下に学習画像とアノテーションファイルが出力される
その他メモ
-
Macのデスクトップ版はUndo/Redoが効かない様子
-
タグエディター上の便利なショートカット3
- 領域のコピー
command + c
- 領域のカット
command + c
- 領域のペースト
command + v
- 複数領域の選択4
ctrl + クリック
- 選択領域を移動
Up/Down/Left/Right
- 次の選択領域
tab
- 領域のコピー
-
「四角形を描画」を選択したまま領域外をクリックすると下図のような領域ができてしまう
-
エクスポートやプロジェクトの保存をすると右上に出てくるダイアログは下のインジケータが空になると消える
-
一つの領域に複数のタグを付けると、領域の上にタグと同じ色の四角が表示される
-
タグの操作(編集、削除、並べ替えなど)をするときは、領域を選択していないか注意する
-
プロジェクトに追加済みの画像を後から消す方法をご存知の方、ぜひご教示ください