mmfewshotについてまとめられている日本語記事がなかったため、備忘録代わりにまとめておく。
few shot learningとは
はじめにFew-shot learning (FSL)とは何かについて軽く説明する。
特徴は以下のような点
- 少数のサンプルから新しいタスクを学習する機械学習のアプローチ
- 事前知識(大規模なデータセットによる学習済みモデルなど)を活用して、新しいタスクに適応する
- 画像分類や物体検出などのタスクに利用される
簡単に言えばファインチューニングなどのこと。
mmfewshotとは
mmfewshotとはOpenMMLab が提供する few-shot learning (FSL) のためのツールボックス。PyTorch をベースにしており、FSL 研究の促進を目的としている。
主な特徴
- 複数FSLタスクのサポート: 画像分類、物体検出などの複数のFSLタスクに対応している
- ベンチマーク: FSLの標準的なベンチマークを提供している
- モジュール性: データセット、モデル、評価指標などがモジュール化されており、柔軟なカスタマイズが可能
用語
- Training set (トレーニングセット): 各クラスに多数のサンプルを持つ十分に大きなデータセットで、ベースとなるモデルの学習に使用される
- Support set (サポートセット): ラベル付き画像の少数のセットで、すべてのクラスがトレーニングセットには存在しない
- Query set (クエリセット): 未ラベルの画像で予測対象の画像。サポートセットと同じクラスを共有する
- N way K shot (NウェイKショット): サポートセットの設定で、サポートセットの画像にN個のクラスが含まれ、各クラスにK個のサンプルがあることを意味する
- classification(分類タスク) サポートセットにはNxK個のサポート画像が含まれる
- detection(検出タスク) サポートセットにはNxK個のサポートインスタンスが含まれる。画像の数はNxKより少なくなることがある
続く