#機械学習における属性評価
機械学習に使用する属性数が多い場合,過学習などにより,精度が低下する可能性があります.
これを防ぐために,属性が持つ情報量を評価し,重要な属性を選択する必要があります.
今回,WEKAを用いて属性評価するやり方および見方をまとめます.
#情報利得による属性評価
- Select attributesタブを選択
- Attribute Evaluatorをweka>attributeSelection>infoGainAttributeEvalに変更
- Serch Methodをweka>attributeSelection>Rankerに変更
- Attribute Selection Modeを選択.Cross-validationに変更することもできます
- Startボタンをクリック
#結果(10Folds Cross-validationで行った場合)
average merit:高い方が重要(+-で10回の交差検定を行った結果の差を表示)
average rank:ランク(+-で10回の交差検定を行った結果の差を表示)
attribute:対象の属性
#まとめ
属性評価をすることによって,その属性がもつ情報量を比べることができます.
しかし,安易に下位の属性を除いてしまうと,精度が下がることもあるので注意が必要です.