10-minute tutorials: Get started with machine learning on Databricks | Databricks on AWS [2021/6/11時点]の翻訳です。
このセクションのノートブックは、皆様がDatabricksの機械学習に関連する機能をすぐに使い始められるために提供されています。これらでは、データロード・準備、モデルトレーニング、チューニング、推論、モデルのデプロイメントおよび管理までを含む機械学習ライフサイクルにおいて、どのようにDatabrikcsを活用するのかを説明しています。ここでは、ハイパーパラメーターチューニングを自動化するためのHyperoptや、モデル開発のためのMLflowトラッキング、オートロギング、モデル管理のためのモデルレジストリのような有用なツールが説明されています。
scikit-learnノートブック
ノートブック |
要件 |
機能 |
機械学習クイックスタート |
Databricksランタイム7.5ML以降 |
分類モデル、MLflow、HyperoptとMLflowを用いたハイパーパラメーターチューニングの自動化 |
モデルレジストリを用いた機械学習 |
Databricksランタイム7.0ML以降 |
分類モデル、MLflow、HyperoptとMLflowを用いたハイパーパラメーターチューニングの自動化、モデルレジストリ |
エンドツーエンドのサンプル |
Databricksランタイム6.5ML以降 |
分類モデル、MLflow、HyperoptとMLflowを用いたハイパーパラメーターチューニングの自動化、XGBoost、モデルレジストリ、モデルサービング |
Apache Spark MLlibノートブック
ノートブック |
要件 |
機能 |
MLlibによる機械学習 |
Databricksランタイム5.5LTS以降 |
ロジスティック回帰モデル、Sparkパイプライン、MLlib APIを用いたハイパーパラメーターチューニングの自動化 |
ディープラーニングノートブック
ノートブック |
要件 |
機能 |
Kerasを用いたディープラーニング |
Databricksランタイム7.0ML以降 |
ニューラルネットワークモデル、インラインのTensorBoard、HyperoptとMLflowを用いたハイパーパラメーターチューニングの自動化、オートロギング、モデルレジストリ |
Databricks 無料トライアル
Databricks 無料トライアル