1. 概要
通常、モデルの学習にはアノテーション/ラベリング付きのデータが必要となるが、モデルが自動的に最も学習に役立つと思われるデータを選択することで効率的に学習を進める方法をアクティブラーニング(Active Learning)という。特に、モデルがまだよく分類できない不確かなデータや境界付近のデータに着目してデータの選択がなされるので、より少ないラベルで性能の高いモデルが構築できる。物体検出のタスクでも有効性が確認されているが、同一画像内のすべての物体に人手でアノテーションをしてもモデルの性能向上には必ずしもつながらないためコスト削減には有用ではなかった。この研究では、情報量の多い物体を優先的に人にアノテーションしてもらえるよう、モデルが自分でわかるところは自動でピックアップし、少ない試行回数でボックスのアノテーションができるようにした。
2. 新規性
画像全体でアノテーションしていた従来のコストのかかる方法から、モデルがまだよくわからない不確かな個所をピックアップしてアノテーションすることで、大幅なアノテーションのコスト削減を実現した。
3. 実現方法
人間のアノテーションとモデルの学習した知識を相互に補完するComplementary Pseudo Active Strategy(ComPAS)というフレームワークを提案している。すでに学習が進んで容易に認識できるターゲットに対しては、システムが自動でラベリングし、学習した時の価値の高いまだ学習の進んでいないターゲットだけを人間に提示する。
4. 結果
VOC0712データセットで100%完全教師有りの性能と同等性能を、わずか19%のボックスのアノテーションのみで実現した。また、COCOデータセットでは従来手法と比べ最大で4.3%のmAPの改善を達成した。
last updates: July 11 2023