LoginSignup
2
1

More than 1 year has passed since last update.

Databricks AutoMLのサンプル集

Last updated at Posted at 2022-08-17

DatabricksでもAutoMLを提供していることをご存知でしょうか。こちらでは、Databricks AutoMLのサンプルノートブックやウォークスルーの記事をまとめています。

AutoMLとは

Screen Shot 2022-08-17 at 9.19.26.png

AutoMLとはAutomated machine learningの略であり、現実世界の問題に対して機械学習を適用する際のタスクを自動化するプロセスのことを意味します。これによって手元にあるデータセットをもちいることでどのような機械学習のメリットが得られるのかをクイックに検証したり、プロジェクトの初期段階で活用するベースラインの機械学習モデルを手に入れることが可能となります。

Screen Shot 2022-08-17 at 9.19.43.png

AutoMLはGUIで行うノーコードの機械学習だと誤解させるような論調もありますが、AutoMLは分類や回帰、予測といった何かしらの問題を機械学習で解決する際に必要となるタスクを自動化するプロセスです。GUIはその際に使用するインタフェースの一つに過ぎません。

Databricks AutoMLとは

Screen Shot 2022-08-17 at 9.20.07.png

Databricks AutoMLでもGUIは提供していますが、大きな特徴は「ガラスボックスアプローチ」です。AutoMLで生み出される大量の機械学習モデルをMLflowで全て自動で記録することに加え、ベストな機械学習モデルがどのように生み出されたのかが全てわかるようになっています。これによって、ベースラインモデルを自動化されたプロセスでクイックに構築し、専門知識を埋め込んでモデルを改善することが可能となります。

Databricks AutoMLにおいては、UIあるいはPython APIでAutoMLを実行することができます。

Databricks AutoMLを活用することで、データセットに対して自動で機械学習を適用することができます。モデルのトレーニングのためにデータセットを準備し、一連の実験を実施、記録し、複数のモデルに対して、作成、チューニング、評価を行います。結果の表示に加えて、中身を確認し、再現、修正できるようにそれぞれの実験のソースコードをPythonノートブック形式で提供します。また、AutoMLはデータセットの統計情報を計算し、後ほど確認できるようにノートブックの中に情報を記録します。

それぞれのモデルは、scikit-learnやXGBoostなどのオープンソースコンポーネントから構築され、容易に修正でき、既存の機械学習パイプラインに組み込むことができます。回帰、分類、予測問題に対してDatabricks AutoMLを活用できます。scikit-learn、xgboost、LightGBMパッケージのアルゴリズムに基づきモデルを評価します。

サンプル集

現時点ではDatabricks AutoMLは分類、回帰、時系列予測の問題に対応しています。対応できる問題やデータの種類に関しては、今後も拡張予定です。

問題 GUI操作のサンプル Python APIのサンプル
分類 Databricks AutoMLを使って分類問題を解いてみる(GUI編) Databricks Community EditionでAutoMLを使って分類問題を解いてみる
回帰 Databricks AutoMLを使って回帰問題を解いてみる(GUI編) Databricks Community EditionでAutoMLを使って回帰問題を解いてみる
時系列予測 Databricks AutoMLを使って時系列予測問題を解いてみる(GUI編) Databricks AutoMLを使って時系列予測問題を解いてみる

注意

  • AutoML Python APIを用いた分類問題、回帰問題へのアプローチ関しては、無料のCommunity Editionでも試すことができます。
  • 無料のCommunity Editionへのサインアップの手順についてはこちらを参考にしてください。また、フルバージョンのDatabricksとの違いに関しては、こちらを参照ください。

参考資料

この他、Databricksでの機械学習に興味がある方はこちらの記事もご覧になってください。

Databricks 無料トライアル

Databricks 無料トライアル

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1