シナリオ
海外に住んでいる親友が不動産投資で数千万円稼ぎまし。ビジネスを広めたがるので、あなたを「ビジネスパートナーになってくれない?」と誘います。彼がお金を出して、データ分析スキルのあるあなたが物件の価格を予測するパータン(モデル)を作ります。
決定木 (Decision Tree)
「どうやって物件の価格を予測、判断しているのか」とあなたが聞きました。
「直感だよ」って答えられました。
機械学習で直感により価格予測モデルを作るのはありえないでしょう?
もっともっと詳細的に聞いて、あなたが何となく分ってきました。
物件の価格が2つグループに分けられます。
つまり、物件価格の予測は、以下2ステップで行われます。
- 物件を2つのグループに分ける
- グループごとの価格をセットする
この手順は、fitting modelもしくはtraining modelと呼ばれます。
モデルをfitするデータは、training dataと呼ばれます。
fitしたモデルを使って、投資しようとする物件の価格を予測しましょう。
モデルを改善する
普通に考えると、決定木1の方が良いと思われますね。大きい物件が小さいのより高いでしょう?ただし、大きさのみで物件価格が決まるわけではないですね。他にも物件価格に影響を与えるたくさん要因(場所、構築年など)があります。
他要因も含めて決定木は以下のようになります。
物件の特徴に相応しいパスを選択して、予測価格は決定木の底ノードにあります。
予測物価を持つ底ノードはleafと呼ばれます。
#次へ
決定木の枝数とleaf値はデータにより決まります。
次回は、データ分析を行いましょう。
他の関連記事はこちらです。