Posted at

機械学習における属性評価

More than 1 year has passed since last update.


機械学習における属性評価

機械学習に使用する属性数が多い場合,過学習などにより,精度が低下する可能性があります.

これを防ぐために,属性が持つ情報量を評価し,重要な属性を選択する必要があります.

今回,WEKAを用いて属性評価するやり方および見方をまとめます.


情報利得による属性評価


  1. Select attributesタブを選択

  2. Attribute Evaluatorをweka>attributeSelection>infoGainAttributeEvalに変更

  3. Serch Methodをweka>attributeSelection>Rankerに変更

  4. Attribute Selection Modeを選択.Cross-validationに変更することもできます

  5. Startボタンをクリック


結果(10Folds Cross-validationで行った場合)

average merit:高い方が重要(+-で10回の交差検定を行った結果の差を表示)

average rank:ランク(+-で10回の交差検定を行った結果の差を表示)

attribute:対象の属性


まとめ

属性評価をすることによって,その属性がもつ情報量を比べることができます.

しかし,安易に下位の属性を除いてしまうと,精度が下がることもあるので注意が必要です.