Databricks Machine Learning guide | Databricks on AWS [2021/9/7時点]の翻訳です。
Databricksクイックスタートガイドのコンテンツです。
この機能はパブリックプレビューです。
Databricks機械学習(Machine Learning)は、エクスペリメントのトラッキング、モデルトレーニング、特徴量開発および管理、特徴量およびモデルのサービングのためのマネージドサービスと連携した、エンドツーエンドの機械学習環境です。以下の図では、Databricksの提供機能がどのようにモデル開発とデプロイメントプロセスにマッピングされるのかを示しています。
Databriks機械学習の概要
Databricks機械学習を用いることで、以下のことが可能となります。
- AutoMLを用いるか、手動によるモデルのトレーニング
- MLflowトラッキングとエクスペリメントを用いた、トレーニングパラメーターのトラッキング
- 特徴量テーブルを作成し、モデルトレーニングおよび推論のために特徴量テーブルにアクセス
- モデルレジストリを用いたモデルの管理およびサービング
また、ノートブック、クラスター、ジョブ、データ、Deltaテーブル、セキュリティ、管理者コンソールなどの全てのDatabricksワークスペースの機能にアクセスすることができます。詳細に関しては、Databricks Data Science & Engineering guideをご覧ください。
機械学習アプリケーションにおいては、Databricks機械学習ランタイムを活用することをお勧めします。
スタートするには、Databricksワークスペースの左のサイドバーにマウスを移動します。マウスを上に持っていくとサイドバーが展開します。サイドバーの上部にあるペルソナスイッチャーからMachine Learningを選択します。Databricksの機械学習ホームページが表示されます。
サイドバーの詳細に関しては、サイドバーの利用をご覧ください。
チュートリアル
ユーザーガイド
- Databricks機械学習ホームページの説明
- Databricks機械学習におけるデータの準備
- Databricks機械学習・ディープラーニング環境のセットアップガイド
- Databricks AutoMLのマニュアル
- Databricksにおけるモデルのトレーニング
- Databricksにおけるモデル開発のトラッキング
- Databricksにおけるモデル推論
- Databricksにおける機械学習モデルの管理
- Databricksにおける機械学習モデルのデプロイ、サービング
- Databricksにおける機械学習モデルのエクスポート、インポート
- Databricksにおける機械学習リファレンスソリューション
- Databricks MLflowガイド