0

L1ノルムとL2ノルム

Posted at 2024-10-27

L1ノルム

定義: ベクトルの各要素の絶対値の和
数式: ||x||₁ = Σ|xᵢ|
別名: マンハッタンノルム
特徴:
- スパースな解を生成しやすい
- 特徴選択に有効　→高次元の入力データを扱う際に特に有用
- 外れ値に対してロバスト　→異常検知タスクに有用
ML, DLにおける利用例:
- 過学習抑制：L1正則化
- 生成モデル：鮮明な画像生成・・・生成画像と真の画像間の絶対誤差を最小化

L2ノルム

定義: ベクトルの各要素の二乗和の平方根
数式: ||x||₂ = √(Σxᵢ²)
別名: ユークリッドノルム
特徴:
- 解析的な解が存在する
- 計算効率が良い
- 多くの場合、より安定した解を生成
ML, DLにおける利用例:
- 過学習抑制：Weight decay・・・正則化手法
- RNN：勾配クリッピング・・・勾配爆発対策

主な違い

スパース性:
- L1ノルムは疎な解(多くの要素が0)を生成しやすい
- L2ノルムは密な解を生成する傾向がある
特徴選択:
- L1ノルムは自動的に特徴選択を行う
- L2ノルムは全ての特徴を保持する
外れ値への感度:
- L1ノルムは外れ値の影響を受けにくい
- L2ノルムは外れ値に敏感
解の一意性:
- L1ノルムは必ずしも一意の解を持たない
- L2ノルムは通常一意の解を持つ
計算効率:
- L1ノルムは解析的な解が存在しないため、計算が複雑になることがある
- L2ノルムは解析的な解が存在し、効率的に計算できる

目的に応じてL1ノルムまたはL2ノルムが選択される。
例えば、特徴選択が重要な場合はL1正則化、モデルの安定性が重要な場合はL2正則化が用いられることが多い。

0

Register as a new user and use Qiita more conveniently

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

0