1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

機械学習入門:モデルの仕組み

Last updated at Posted at 2019-12-19

シナリオ

海外に住んでいる親友が不動産投資で数千万円稼ぎまし。ビジネスを広めたがるので、あなたを「ビジネスパートナーになってくれない?」と誘います。彼がお金を出して、データ分析スキルのあるあなたが物件の価格を予測するパータン(モデル)を作ります。

決定木 (Decision Tree)

「どうやって物件の価格を予測、判断しているのか」とあなたが聞きました。
「直感だよ」って答えられました。
機械学習で直感により価格予測モデルを作るのはありえないでしょう?
もっともっと詳細的に聞いて、あなたが何となく分ってきました。
simple-decision-tree.JPG

物件の価格が2つグループに分けられます。

つまり、物件価格の予測は、以下2ステップで行われます。

  1. 物件を2つのグループに分ける
  2. グループごとの価格をセットする

この手順は、fitting modelもしくはtraining modelと呼ばれます。
モデルをfitするデータは、training dataと呼ばれます。

fitしたモデルを使って、投資しようとする物件の価格を予測しましょう。

モデルを改善する

どれの決定木がtraining dataに合っていますか。
which-tree.JPG

普通に考えると、決定木1の方が良いと思われますね。大きい物件が小さいのより高いでしょう?ただし、大きさのみで物件価格が決まるわけではないですね。他にも物件価格に影響を与えるたくさん要因(場所、構築年など)があります。
他要因も含めて決定木は以下のようになります。
deeper-tree.JPG

物件の特徴に相応しいパスを選択して、予測価格は決定木の底ノードにあります。
予測物価を持つ底ノードはleafと呼ばれます。

#次へ
決定木の枝数とleaf値はデータにより決まります。
次回は、データ分析を行いましょう。

他の関連記事はこちらです。

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?