0
0

More than 1 year has passed since last update.

Databricks AutoMLでアルゴリズムを選択できるようになりました

Last updated at Posted at 2022-02-23

Databricks AutoMLのマニュアルでも説明されているように、Databricks機械学習ランタイム10.3以降では、AutoMLで使用するアルゴリズムを選択できるようになりました。ビジネス要件、機能要件によっては特定のアルゴリズムに限定したいというケースがあるかと思いますが、そのようなケースに対応することができます。

  1. 事前にトレーニングに使用するデータを準備しておき、メタストアに登録しておきます。
  2. Databricks機械学習ランタイム10.3以降が稼働するクラスターを作成して、起動しておきます。
    Screen Shot 2022-02-23 at 9.33.04.JPG
  3. サイドバーのペルソナスイッチャーでMachine Learningを選択し、Experimentsをクリックします。
  4. Create AutoML Experimentをクリックします。
  5. Computeでは上で作成したクラスターを選択します。
  6. ML problem typeでは問題のタイプ(回帰、分類、時系列予測)を選択し、Datasetでは、事前に準備しておいたトレーニングデータセットを選択します。
  7. Prediction targetには目的変数のカラムを指定します。
    Screen Shot 2022-02-23 at 9.45.11.JPG
  8. さらにAdvanced Configuration (optional) を展開します。
  9. するとTraining frameworksに使用されるフレームワークが列挙されていますので、必要に応じて取捨選択を行います。
    Screen Shot 2022-02-23 at 9.46.51.JPG

これでトレーニングを行うと選択されたフレームワークのみが使用されるようになります。以下の例ではscikit-learnのみが使用されています。
Screen Shot 2022-02-23 at 9.54.09.JPG

また、Alertsをクリックすると、データに関する警告が表示されますので、トレーニングデータの見直しが必要かどうかの判断に活用することができます。
Screen Shot 2022-02-23 at 9.54.27.JPG

Databricks 無料トライアル

Databricks 無料トライアル

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0