0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

機械学習エンジニアとしてDatabricksを使い始める

Last updated at Posted at 2022-02-22

Get started with Databricks as a machine learning engineer | Databricks on AWS [2022/2/22時点]の翻訳です。

Databricksクイックスタートガイドのコンテンツです。

本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。

ここで列挙されているクイックスタートとチュートリアルは、皆様がDatabricksで機械学習をクイックにスタートできるようにすることを狙いとしています。それぞれには、ご自身のDatabricksワークスペースにインポートして実行できるノートブックが含まれています。これらは、データロード、データ準備、モデルトレーニング、チューニング、推論、モデルデプロイメント、モデル管理を含む機械学習ライフサイクルを通じて、どうのようにDatabricksを活用するのかを説明しています。これらは、自動化ハイパーパラメーターチューニングのためのHyperopt、モデルデプロイメントのためのMLflowのトラッキング、オートロギング、モデル管理のためのモデルレジストリのような有用なツールを説明しています。

注意
これらのチュートリアルに含まれているノートブックを実行するには、チュートリアルページのノートブックの上にあるをクリックしてください。お使いのDatabricksワークスペースのブラウザで、任意のフォルダーメニューからImportを選択し、URLを貼り付けてください。ノートブックを実行するには、実行するためのクラスターが必要となります。クラスターの作成とノートブック実行の詳細については、データサイエンティストとしてDatabricksを使い始めるを参照ください。

Databricksを初めて触る方に

Databricksの機械学習を始めるには、以下の手順に従ってください。

  1. データサイエンティストとしてDatabricksを使い始めるをトライしてください。

  2. Databricksの機械学習環境に含まれるクイックスタートノートブックを実行してください。

    このノートブックでは、MLflowによるモデル開発のトラッキングやハイパーパラメーターチューニングの並列実行など、機械学習でDatabrikcsを利用するメリットを説明しています。このノートブックでは、どのようにデータをロードし、モデルをトレーニング・チューニングし、モデルのパフォーマンスを比較・分析し、モデルを推論に使う方法をウォークスルーしています。

製品に含まれているクイックスタートノートブックを実行するには、以下のステップを踏んでください。

  1. お使いのDatabricksワークスペースにログインし、Databricks Machine Learning環境に移動します。

    ペルソナを変更するには、Databricksロゴの下のアイコンをクリックし、Machine Learningを選択します。

  2. Databricks Machine Learningスタートページで、右上のStart guideをクリックします。

scikit-learnのチュートリアル

ノートブック 要件 機能
機械学習クイックスタート Databricks機械学習ランタイム7.5以降 分類モデル、MLflow、HyperoptとMLflowによる自動ハイパーパラメーターチューニング
モデルレジストリを用いた機械学習 Databricks機械学習ランタイム7.0以降 分類モデル、MLflow、HyperoptとMLflowによる自動ハイパーパラメーターチューニング、モデルレジストリ
エンドツーエンドのサンプル Databricks機械学習ランタイム6.5以降 分類モデル、MLflow、HyperoptとMLflowによる自動ハイパーパラメーターチューニング、XGBoost、モデルレジストリ、モデルサービング

Apache Spark MLlibチュートリアル

ノートブック 要件 機能
MLlibによる機械学習 Databricks機械学習ランタイム5.5LTS以降 ロジスティック回帰モデル、Sparkパイプライン、MLlib APIを用いた自動化ハイパーパラメーターチューニング

ディープラーニングチュートリアル

ノートブック 要件 機能
TensorFlow Kerasを用いたディープラーニング Databricks機械学習ランタイム7.0LTS以降 ニューラルネットワークモデル、インラインのTensorBoard、HyperoptとMLflowを用いた自動化ハイパーパラメーターチューニング、オートロギング、モデルレジストリ

Databricks 無料トライアル

Databricks 無料トライアル

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?