機械学習
weka
属性
属性評価
情報利得

機械学習における属性評価

機械学習における属性評価

機械学習に使用する属性数が多い場合,過学習などにより,精度が低下する可能性があります.
これを防ぐために,属性が持つ情報量を評価し,重要な属性を選択する必要があります.

今回,WEKAを用いて属性評価するやり方および見方をまとめます.

情報利得による属性評価

  1. Select attributesタブを選択
  2. Attribute Evaluatorをweka>attributeSelection>infoGainAttributeEvalに変更
  3. Serch Methodをweka>attributeSelection>Rankerに変更
  4. Attribute Selection Modeを選択.Cross-validationに変更することもできます
  5. Startボタンをクリック

結果(10Folds Cross-validationで行った場合)

average merit:高い方が重要(+-で10回の交差検定を行った結果の差を表示)
average rank:ランク(+-で10回の交差検定を行った結果の差を表示)
attribute:対象の属性

まとめ

属性評価をすることによって,その属性がもつ情報量を比べることができます.
しかし,安易に下位の属性を除いてしまうと,精度が下がることもあるので注意が必要です.