Get started with machine learning in Databricks | Databricks on AWS [2021/6/24時点]の翻訳です。
Databricksクイックスタートガイドのコンテンツです。
このノートブックでは、Databricksにおける機械学習モデルトレーニングの概要を説明します。モデルをトレーニングするには、Databricks機械学習ランタイムにプレインストールされているscikit-learnのようなライブラリを利用することできます。加えて、トレーニングしたモデルをトラッキングするためにMLflowを利用したり、ハイパーパラメーターチューニングをスケールさせるために、HyperoptとSparkTrialsを活用することができます。
このチュートリアルでは、モデル開発をトラッキングするためにMLflowを用い、モデルのパフォーマンスを改善するためにHyperoptを用いて、シンプルな分類モデルをトレーニングします。モデルのライフサイクル管理やモデルの推論などDatabricksにおける機械学習の本格運用に関しては、エンドツーエンドのサンプルをご覧ください。
Databricksにおけるクイックスタートの他のサンプルノートブックについては、Databricksにおける機械学習の10分チュートリアルをご覧ください。
要件
Databricks機械学習ランタイム7.5以降が必要となります。
サンプルノートブック