決定木 (decision tree)とは
機械学習(教師あり学習)の手法の1つ.分布しているデータの適切な境界線を求めるアルゴリズム.条件分岐により,データを分けていくことを繰り返すという流れ.
メリット
- 学習結果を木構造で表せるため,説明変数と目的変数の因果関係が明らかになる解釈性の高いモデルといえる.
- データの前処理と,予測の煩わしさが少ない.
- 外れ値の影響を受けにくい.
デメリット
- 条件分岐が不適だと過学習する.
- 分類性能が高いとは言えない.⇢ **剪定(枝刈り)**を行う.
ランダムフォレスト
決定木に,バギング(アンサンブル学習)を組み合わせた手法
Xgboost
CART, C4.5 ジニ係数,エントロピー
見るべき解説動画
数式を交えた解説動画
ハンズオンによる説明