先週github上で「lazypredict」という面白いライブラリを見つけました。
これを使うと、データがすべてのモデル上でのトレーニング結果を表示することができます。
Colab上で「カリフォルニア住宅価格データ」を使って価格予測の回帰トレーニング試してみました
モデルのトレーニング結果は以下となります。一部だけのスクリーンショットですが、全部では約40個のモデルの結果が表示されます。
回帰問題なのでデフォルトの評価指標はR-SquaredとRMSEですね。分類問題にすると混同行列になります。
また、"custom_metric"というパラメーター使えばカスタマイズ評価指標の結果も出せるようになります。
あとは処理時間(TimeTaken)も見れます。
複数モデルのために、ハイパーパラメーターチューニングはできないですが、データマイニングのケースではハイパーパラメーターチューニングもそれほど重要ではないため、確認用としては特に問題ないと思います。
もちろんモデルに関しては、比較せずLightGBMにしても良いのですが、資料作成の時に「こういう比較結果ありますよ」みたいな感じで活用できるではないかと思います。
興味ある方試してみてください。
github: https://github.com/shankarpandala/lazypredict