SageMaker Clarify
『モデルの予測におけるバイアスを検出し、モデルの透明性を向上させることができる』
バイアス検出
モデルやデータに潜在的なバイアスがないかを検出するための機能です。
-
データのバイアス検出
モデルのトレーニングデータセット内で、特定のグループやカテゴリが不均衡に扱われていないかを検出します。例えば、性別や人種などのセンシティブ属性です。 -
モデルのバイアス検出
モデルが特定のグループに対して偏った予測を行っていないかを評価します。
モデルの説明可能性
モデルがどのように予測を行ったのかを説明する(透明性)ための機能も提供します。
これにより、モデルが どの特徴量が予測に対してどの程度の影響を与えているか を明確に理解できます。
バイアス検出のタイミング
-
トレーニング前(データの前処理後)
データセット内のバイアスを検出します。前処理が完了した後に、データの重複や外れ値などが偏りの原因となっていないかを分析します。 -
トレーニング後(モデルの予測結果を評価)
トレーニング済みモデルの予測結果に基づいて、特定のグループに対して偏った結果が出力されていないかを評価します。
評価
差分インパクト
バイアスを検出 するために、SageMaker Clarifyが使用する指標の一つです。この値により、異なる属性に基づく予測結果のバイアスを検出します。
Shapley値
SageMaker Clarify は、モデルの予測結果に対する 各特徴量の寄与度を評価 するために、Shapley値を使用します。
これにより、モデルの予測結果を説明可能にし、各特徴量の重要性を理解することができます。