【理論】
Feature Engineering
Discover Feature Engineering, How to Engineer Features and How to Get Good at It
カテゴリカル変数のEncoding手法のまとめ
Feature Engineering: Data scientist's Secret Sauce !
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
【実装】
DataFrameで特徴量作るのめんどくさ過ぎる。。featuretoolsを使って自動生成したろ
featuretoolsについてはHome Credit Default Riskの公開カーネルでも言及されてました。
Will Koehrsenさんは手動と自動の両方のカーネルを公開しており非常に勉強になる。
Automated Feature Engineering Basics
Introduction to Manual Feature Engineering
Introduction to Manual Feature Engineering P2
KaggleのWinner solutionにもなった「K近傍を用いた特徴量抽出」のPython実装
カテゴリカル変数のEncoding手法について
fast_feng
学習アルゴリズム以外のscikit-learn便利機能と連携ライブラリ
遺伝的プログラミングによる特徴量生成
遺伝的プログラミングによる特徴量生成でLightGBMの精度向上
【Coursera】
How to Win a Data Science Competition: Learn from Top Kagglers
https://www.coursera.org/learn/competitive-data-science
【本】
特徴量エンジニアリングに焦点を当てた簡潔な本:「Feature Engineering for Machine Learning」
これ翻訳権取られていたので、どこかで翻訳が進んでいるはず。とても良い本なのでオススメです。 https://t.co/XEs4mnILfJ
— piqcy (@icoxfog417) 2018年7月24日
2月23日にオライリーから出版予定です。
[機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践][1]
[1]:https://www.amazon.co.jp/dp/4873118689/ref=as_li_ss_tl?ie=UTF8&qid=1547182598&sr=8-2&keywords=Python%E7%89%B9%E5%BE%B4%E9%87%8F%E3%82%A8%E3%83%B3%E3%82%B8%E3%83%8B%E3%82%A2%E3%83%AA%E3%83%B3%E3%82%B0&linkCode=sl1&tag=hoxom023-22&linkId=b69947b517c075acb5a12e6a41e08993&language=ja_JP