データ拡張とは
機械学習の世界でコンピューターに画像認識や推論を行わせようとする際に訓練データを学習させる必要があります。この訓練データですが、実際の現場では充実していないケースが珍しくありません。その問題を解決する方法の1つが「データ拡張」です。
具体的な加工方法
データ拡張ではデータの水増しをします。画像の訓練データを例に説明しましょう。画像認識ではその画像が人なのか車かなどを判別するために様々な訓練データが必要になります。少ない訓練データをどのように水増しするかというと、画像を回転・拡大・縮小・一部を切り取るなどして訓練データを増やします。回転する際はその角度を複数設定し、他の加工であっても様々なパラメータを変更することができます。このような加工によって1つのデータから複数の訓練データを生み出すことが可能になりモデルの能力を向上させることができます。