ITエンジニアになりたいなって思ったので、とり合えずブログに書いてみようと始めます。
正規化、標準化をしらべたきっかけ
MNISTの手書き文字認識のモデルを作っていて、ピクセルのデータを255で割っているのを見てなんでやろって思って調べてみた
画像のデータをなんで正規化するのか
正直あんまわからんかった
一言でいうとデータが扱いやすくなる
学習コストを下げてくれるらしい。。
勾配の伝播にも有効なのだとか
その他特徴量が複数あることきの正規化、標準化
これはわかった!
例えば、身長と体重をインプットとするモデルを作るとき、
そのままの値を入れると、それぞれの特徴量の範囲や大きさが異なるので、
一方の特徴量の影響が大きくなったりする
これだと、身長がでかいからその影響が大きくなる
正規化、標準化のやり方
正規化
最大値で割る
デメリットとして、外れ値でバカでかい値とかがあると、データが狂う
標準化
分散1、平均0となるようにする
→ー1~1の間に約7割のデータがあるようにする
とりま標準化しとけば安パイ
最大値が決まっているような、画像データとかは正規化が使われる