機械学習に関する基本的な内容をまとめてみたものです。機械学習に関する、Web上にすでにある解説コンテンツをまとめたサイトの抜粋です。
機械学習モデルの構築プロセス
学習プロセスの構成
機械学習プロセスは、
・データの分析
・学習モデルのトレーニング
・評価
から構成されますが、Amazon Machine Learningには各ステップの作業に役立つツールが用意されています。
データの分析
データ分析では、学習モデルのトレーニングに使用するデータの内容を検討して、より適切な予測が可能となるようにデータを変換します。
・変数の値とデータの特徴の関係性
・各変数とターゲットの相関関係
などに注意をしてデータ分析を行います。
データを変換する必要がある時は、
・意味のない値を有効な値に置き換える
・数値変数をカテゴリに変換する
などの特徴抽出処理を行いますが、Amazon Machine Learningでは入力データに対して自動的にデータ変換のアドバイスが行われます。
学習モデルのトレーニング
Amazon Machine Learningの機械学習アルゴリズムが訓練データを使って学習を行い、有効な学習モデルを構築します。
構築された機械学習モデルに新しいデータを入力すると、学習した内容に従って適切な予測を行れるようにトレーニングが行われます。
評価
構築した学習モデルは予測の正確性について評価しなくてはなりませんが、Amazon Machine Learningには、品質メトリックスを評価してモデルの動作を可視化するツールが用意されています。
Amazon Machine Learningの評価ツールによって、学習モデルを詳細に評価する事が可能となり、予測をどのように調整すれば良いのか調査するのに役立ちます。