よく使う設定なのでここに記録
data %>>% (rpart(y~x_1+x_2+x_3, ., method="class", cp=.0000001, maxdepth=4)) %>>% (~ plot(., uniform=T, margin=.1)) %>>% (~ text(., use.n=T, all=T, digits=5)) %>>% (summary(.))
-
%>>%
パイプ処理。 package pipeRを入れとくと使える -
rpart
:決定木を出してくれる君-
y~x_1+x_2+x_3
:y
が結果変数、x_i
が説明変数 -
method="class"
:y
の値の分類を目的とするときはmethod
をclass
に。- 他には、、、
-
anova
,poisson
,exp
を指定可能。使ったこと無いので分かりません
-
cp
:complexity parameterの略。小さいほど、深い決定木を出してくれる -
maxdepth
:深さの上限を設定。cpを小さくしてmaxdepthで調整という暴力が安易で良い(よくない)
-
-
plot.rpart
-
uniform=T
:可視化した時の縦棒の長さを揃えてくれる- なんでdefaultはfalseなんだ?
-
margin=.1
:こうしないとテキスト書き込んだときに端が切れる。実質おまじない
-
-
text.rpart
:文字列を書き入れる-
use.n=T
:各所に、どの属性に何データ入るかを表示してくれる -
all=T
:決定木の条件分岐の全てに数値を書き込む設定 -
digits
:ほっとくと値を丸める。丸めてほしくないときに大きめの値を入れている
-