Wekaとは
http://weka-jp.info/
機械学習の統合環境
インストール
https://www.cs.waikato.ac.nz/ml/weka/downloading.html
より、自分のOSに合ったものをダウンロードして、インストールする。
データの用意
Wekaで分類するデータは、arff と呼ばれる形式にする必要がある。
waikato大学のウェブページより
@RELATION iris
@ATTRIBUTE sepallength NUMERIC
@ATTRIBUTE sepalwidth NUMERIC
@ATTRIBUTE petallength NUMERIC
@ATTRIBUTE petalwidth NUMERIC
@ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica}
@DATA
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa
5.4,3.9,1.7,0.4,Iris-setosa
4.6,3.4,1.4,0.3,Iris-setosa
5.0,3.4,1.5,0.2,Iris-setosa
4.4,2.9,1.4,0.2,Iris-setosa
4.9,3.1,1.5,0.1,Iris-setosa
@relation <relation-name>
@attribute <attribute-name> <datatype>
<datatype>には、以下のデータ形式を指定する。
numeric (数字。つまり整数か実数)
(有限の記号。例えば、YESとNOとか。)
string (文字列)
date [] (日時。は省略可能。省略した場合は、"yyyy-MM-dd'T'HH:mm:ss")
nominal-specificationは、中カッコ「{ }」で囲んで、カンマで区切る。例は上記にある通り。
YESとNOなら、{YES,NO} といった感じ。
決定木で機械学習
Test options
の下に表示されているものが、分類される対象のデータ。
sample.arffの属性の最後の行に記述されているものが表示されるが、タップして変更することも可能。
Start
ボタンを押す。
Summary
のCorrectly Classified Instances
に書かれているのが、分類精度。
今回のサンプルデータだと 100%!
まとめ
分類器 Classifier
を選択する際に他のものを選択するだけで、SVM
やRandom Forest
なども簡単にできる。