LoginSignup
37

More than 5 years have passed since last update.

WEKAの使い方

Last updated at Posted at 2018-02-04

WEKAとは

機械学習統合環境 Wekaと ベンチマークデータ - 山本 研究室

フリーの機械学習統合環境
- 研究,教育,実務など幅広い利用が可能
- データの前処理,多様な学習アルゴリズム,評価手法の理解ができる.
- データの可視化などのGUIを備えている

だそうです.
初めて機械学習に触れるには手っ取り早い方法です.
自分で取ってきたデータを様々な機械学習アルゴリズムで分類することができます.

インストール

以下のリンクから,自分のOSに合わせてダウンロード
Weka 3

スクリーンショット 2018-01-28 16.07.48.png

分類するデータの用意

WEKAは自分が用意したデータを読み込んで分類することができます.
この際,arffと呼ばれる形式にする必要があります.

test.arff
@relation keyboard

@attribute time real
@attribute speed real
@attribute angle real
@attribute curve real
@attribute emotion {sad, happy}

@data
1,0.1,46,1.81,sad
2,0.6,187,4.7,happy

@relation [文字列]

keyboardがデータセットの名前です.
好きなように設定します.

@attribute [属性の名前] [属性の型]

属性の名前と属性の型を記述します.
属性の型は,データが数値の場合は,real.
そうでない場合は,{}で囲みます.
また,分類したいものを最後に記述します.

@data

これ以降に,自分のデータを入力します.
自分が記述した属性データに合わせて記述します.
今回は,time, speed, angle, curve, emotionの値が1行に入ります.

決定木で機械学習

  1. Explorerを開きます
    スクリーンショット 2018-01-28 16.07.48.png

  2. Open fileから先ほど作成したtest.arffを選択
    スクリーンショット 2018-01-28 16.31.04.png

  3. Classifyタブを選択
    スクリーンショット 2018-02-04 19.47.38.png

  4. Chooseからweka>classifiers>trees>J48を選択
    スクリーンショット 2018-02-04 19.47.38 2.png
    スクリーンショット 2018-02-04 19.52.11.png

  5. Test optionでどんな検定をするか設定できます.デフォルトだと10分割交差検定.
    スクリーンショット 2018-02-04 19.53.15.png

  6. Test optionの下に表示されているものが,分類される対象のデータとなります.
    test.arffの属性の最後の行に記述されているものが表示されますが,タップして変更することもできます.
    スクリーンショット 2018-02-04 20.00.36.png

  7. Startボタンを押すだけ!

SummaryのCorrectly Classified Instancesに書かれているのが,分類精度となります.
今回だと,79.1683%です.

スクリーンショット 2018-02-04 20.03.37.png

まとめ

WEKAを初めて使う際の参考になれば幸いです.
Classifierを選択する際に他のものを選択するだけで,SVMやRandom Forestなども簡単にできます.

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
37