はじめに
こんにちは。論文を読んだ結果の紹介記事です。
今回紹介するのは、「運用時AI 品質維持技術:コンセプトドリフト検知・適応から教師なしドメイン適応まで」という論文です。
- タイトル: 運用時AI 品質維持技術:コンセプトドリフト検知・適応から教師なしドメイン適応まで
- 出典: 2023年度人工知能学会全国大会(第37回) (2023)
- URL: https://www.jstage.jst.go.jp/article/pjsai/JSAI2023/0/JSAI2023_2R4OS1205/_pdf/-char/ja
概要
機械学習技術を用いたAIシステムの運用においては、データの取得環境の違いや時間経過によって、運用時に新たに取得する入力データの分布が元の訓練データの分布から変化し、システムの性能低下を引き起こす恐れがある。特に、コンセプトドリフトと呼ばれるデータおよびその正解ラベルの同時分布の変化は、性能低下を引き起こす主な原因の1つである。
特徴
-
ドリフト検知、適用
検知には、確信度スコアの変化に従う手法、教師なしの一種であるクラスタリングを用いた手法などがある。
適用には、クラスタリングを用いた手法、機械学習モデルを組み合わせた手法などがある。 -
UDA技術を用いた変化への対応
正解ラベルのないターゲットデータに対して疑似ラベル付けを行う。
ソースモデル学習時には含まれていない未知クラスの出現や、その反対に学習したクラスの一部のクラスのみ出現する場合などにおいても有効に働くことが示されている。 -
ソースフリー教師なしドメイン適応手法
訓練データを再利用せずに適応を行う.
生のソースデータを用いずに、ターゲットデータの特徴量が機械学習モデル内部の特徴空間上でクラスごとに識別可能となるように、各ターゲットインスタンスに疑似ラベル付けしながら学習を行う。疑似ラベル付けのためには、特徴空間上での各クラスの特徴量の中心または代表点からの距離を用いる手法や、複数モデルの予測結果を用いる手法がある。 -
Test-time 適応手法
運用前の訓練データを用いずに機械学習モデルをオンライン適応させる。
想定される適用例
- 画像分類、セマンティックセグメンテーション、物体検知