こんばんは、すきにーです。
E資格2024#2 から新シラバスになるみたいです。
https://www.jdla.org/news/20230915003/
現行のシラバスになく、自分も知らなかった用語について調べました。
新シラバスの試験範囲一覧
グレーで網掛けられているところはオプション(出題対象外)みたいです
この中の
・能動学習(Active Learning)
Uncertainty Sampling、Least Confident、Representative Sampling
・連合学習(Federated learning)
クロスデバイス学習、クロスサイロ学習、Federated Averaging、Local Model、Global Model
が、完全新規で追加された箇所だったので調べました。
(注)グレーのオプション部分なので、試験に出る可能性は低いと思います。
能動学習(Active Learning)
能動学習とは
能動学習とは、機械学習の一つで、ラベル付きデータが限られている状況で効率的に学習モデルを訓練するための方法の一つ。
例えば、犬猫の画像分類タスクで、写真にラベル(犬か猫か)が少ないときに、明らかに犬か猫かが分かるデータはAIが分類し、AIが判断に迷うデータは人間がラベル付けをすることを能動学習と言います。
分かりやすいラベリングはAIにやってもらい、分かりにくい写真は人間がラベリングしてAIを補助するという感じです。
モデルの学習にとって高い価値があるデータだけ人間がラベル付けをすることで、モデルの学習を効果的に進められるというメリットがあります。
サンプリング方法
能動学習では、未ラベルのデータセットから最も学習に有益なデータを選択するためのさまざまなサンプリング方法があります。
代表的なものが「Uncertainty Sampling」「Least Confident」「Representative Sampling」の3つです
Uncertainty Sampling(不確実性サンプリング)
Uncertainty Samplingでは、モデルが最も不確実である、つまり、どのクラスに所属するかを予測するのが難しいデータ点を選択します。
犬猫分類の場合は「犬」と「猫」の間で判定が難しい写真を選択し、人間がラベリングします。
Least Confident
Uncertainty Samplingの一形態で、モデルが最も確信を持っていないデータ点を選択します。
Representative Sampling
大量の写真の中から代表的なもの、つまり他の多くの写真を代表するような写真を選択します。
犬猫分類を例に説明します。犬猫の写真が大量にあって、それぞれ以下の3種類に分けられるということが分かっているとします。
①庭で遊んでいる犬や猫の写真
②ソファでくつろぐ犬や猫の写真
③飼い主と一緒に写っている犬や猫の写真
この場合に、①②③の写真で、犬猫が真ん中に映っている写真(= 代表的な写真)を選択しラベリングを行うことで、少ないラベリングで効率的にモデルの学習を行うことができます。
実世界への応用
医療画像の解析
→ 「MRIによる画像からガンと正常細胞を見分ける」というタスクについて、見分けるのが簡単な領域については機械が自動的に判断し、分類が難しい境界領域だけを専門の医師に見てもらう
参考:https://medtech-today.com/2021/01/15/post-585-2/
能動学習の参考サイト
連合学習(Federated learning)
連合学習とは
連合学習とはデータの中心的な集約や共有を避けることができる機械学習のアプローチの一つです。
各デバイスはローカルデータを使ってモデルを更新し、その更新情報を中央のサーバーに送信します。サーバーはこれらの更新情報を集約し、グローバルなモデルを更新します。
例:10人がスマホのキーボードの予測文字機能を向上させるために、それぞれのスマホで個々に学習を行う。その結果を共有して汎用的なモデルの更新を行う。ただし、入力したテキストデータそのものは共有しない。
画像元:https://www.msiism.jp/article/federated-learning.html
連合学習のメリット
従来のやり方と比べてプライバシー・セキュリティの保護性が高い
→ 連合学習では生の学習データを外部に共有しないため、プライバシー・セキュリティの保護がしやすい
関連用語
クロスデバイス学習
概要:多くのデバイスで学習を行い、その結果を中央で統合するアプローチ。
例:AndroidとiOSの両方のスマホで学習を行い、その学習結果を一つにまとめる。
クロスサイロ学習
概要:異なる組織やデータ保管場所での学習結果を統合するアプローチ。
例:病院Aと病院Bがそれぞれの患者データで医療AIを学習させ、その学習結果だけを共有してAIを向上させる。
Federated Averaging
概要:複数のデバイスの学習結果(モデルの重みなど)を平均化して、中央のモデルを更新する手法。
例:10人の友人がそれぞれのスマホでキーボードの予測を学習。学習後のモデルの重みを共有し、その平均値を使って中央の予測モデルを更新する。
Local Model
個々のデバイスや組織で独立して学習されるモデル。
画像の赤枠部分
Global Model
中央で集約された学習結果をもとに更新されるモデル。
画像の青枠部分
連合学習の参考サイト