1
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

【初心者向けハンズオン】kaggleの「住宅価格を予測する」を1行ずつ読み解く(第8回:予測モデルの構築)

Posted at

お題

 有名なお題であるkaggleの「House Price」問題にみんなでチャレンジしていくことになったハンズオンの内容をメモしていく企画の第8回。解説というよりはメモのまとめだったりもしますが、どこかの誰かのためになれば幸いです。前回で準備がおわり、いざ解析段階にはいって、統計の勉強をもっとしておけばよかったと反省に反省を繰り返す状態です。

本日の作業

予測モデルの構築

StandardScaler() #スケーリング

とりあえず以下の記事を読みます。そして本日は感想を書きます。

わかったこと:

  • 特徴量の取りうる値、範囲を調整して同じ範囲に収めるよう変換してくれる。
  • 例)「売上に効いてくる特徴量」で『訪問者数』『気温』とした場合、単純に『訪問者数』のほうが差分が大きく出てしまい、重要さの判定に実測に沿わない影響を及ぼす。
  • スケール変換はいくつか手法がある。記事記載の内容のうち、今回使っているのはよくつかう(?)「StandardScaler変換」

Lasso回帰モデル

とりあえず以下の記事を読みます、そして本日は感想を書きます(2度め)。

わかったこと:

  • 今回は物件情報ということもあり、説明変数も多いためLasso回帰を採用。

パイプライン構築

わかったこと:

  • スケーリング、クラス生成などもろもろ流れをつくってくれる、と。(これは完全にわかったつもりになりたいやつの文章だ…)

おしまい。

本日は一切コードを書かずに読み込みをする作業になりましたが、やはり背景知っとくのは大事というか、このハンズオンをやったあとに体系的にやると、なるほどとなりそうな気がした。

1
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?