#学習の流れ
-
実施内容の決定
-
データ入手
-
データ前処理
-
手法選択
-
ハイパーパラメータ選択
-
モデルの学習
-
モデルの評価 → 3、4、5へ
#訓練データとテストデータを分ける理由
・システムリリース時
持っている全データを訓練データとしても良い
・精度評価を行いたい場合
訓練データとテストデータを分け、訓練データのみから学習したモデルでテストデータを評価する
教師あり学習の目的が、未知のデータに対する予測であるため
#適合不足と過学習
##適合不足
・訓練データに対しても予測精度が低い状態
##過学習
・訓練データによくフィットしているが、テストデータ(未知のデータ)に対する予測精度が低い状態
適合不足と過学習のバランスをいかにうまく取るかが機械学習の一番難しいところ