機械学習に関する基本的な内容をまとめてみたものです。機械学習に関する、Web上にすでにある解説コンテンツをまとめたサイトの抜粋です。
AMLにおける学習モデルの構築方法
学習や前処理などについての設定
Amazon Machine Learningで学習モデル構築の際には、使用するデータソースを選んでから、学習設定の方針を選択します。
学習の設定については、
・推奨設定
・手動での設定
のどちらかを選べます。
手動で設定する場合はrecipe画面にて、
・データの前処理
・変換処理
・特徴量の抽出
などを設定して行きます。
学習パラメータの設定
recipe画面での設定の後は、
・モデルの最大サイズ
・パス数
・正則化
などの学習パラメータの設定を行います。
モデルの最大サイズ
・データパターンを保持する量を設定します
・最大サイズを超えたパターンについては廃棄されます
・大きなサイズを設定すると、処理する時間が増えて料金負担が大きくなります
パス数
・データパターンを検索する時のパス数を設定します
・パス数を大きくすると予測精度を向上させる事が出来ますが、コストも増加します
正則化
・過学習を防ぐために、学習モデルの自由度などを制限します
・適切に正則化を利用しないと、訓練用データに特化されてしまいます
評価の設定
評価の設定では、評価するためのデータソースを選択する事が出来ます。
評価用データソースとして、
・専用の評価用データソース
・訓練用データソースを分割して使用
などを選ぶ事が可能です。