0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Databricksのクラスターライブラリ

Posted at

Cluster libraries | Databricks on AWS [2021/7/16時点]の翻訳です。

本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。

クラスターライブラリは、クラスターで実行される全てのノートブックで使用することができます。PyPIやMavenのように公開されているリポジトリ、事前にインストール済みのワークスペースライブラリ、initスクリプトを用いてクラスターライブラリをインストールすることができます。

クラスターにライブラリをインストールする

クラスターにライブラリをインストールするには主に2つの方法があります。

  • ワークスペースにすでにアップロードされているワークスペースライブラリをインストールする。
  • 特定のクラスターでのみ使用するライブラリをインストールする。

さらに、お使いのライブラリがカスタム設定を必要とする場合には、上述した方法でライブラリをインストールすることができないかもしれません。その場合には、クラスター作成時に実行されるinitスクリプトを用いてライブラリをインストールすることができます。

注意
クラスターにライブラリをインストールする際、当該クラスターにすでにアタッチされているノートブックで即座に新規ライブラリを参照できません。まずクラスターからノートブックをデタッチし、再度クラスターにノートブックを再度アタッチしてください。

ワークスペースライブラリ

注意
Databricksランタイム7.2以降では、クラスターにインストールされた順序で、Databricksは全てのワークスペースのライブラリを処理します。Databricksランタイム7.1以前では、MavenとCRANのライブラリは、クラスターにインストールされた順序で処理しされます。

ライブラリ間に依存関係がある場合には、クラスターにライブラリをインストールする順番に注意してください。

ワークスペースにすでに存在しているライブラリをインストールするには、クラスターUIかライブラリUIからスタートすることができます。

クラスター

  1. サイドバーのComputeをクリックします。
  2. クラスター名をクリックします。
  3. Librariesタブをクリックします。
  4. Install Newをクリックします。
  5. Library SourceのボタンリストでWorkspaceを選択します。
  6. ワークスペースライブラリを選択します。
  7. Installをクリックします。
  8. 全てのクラスターにライブラリがインストールされるように設定するには、以下の設定を行います。
    1. ライブラリをクリックします。
    2. Install automatically on all clustersチェックボックスを選択します。
    3. Confirmをクリックします。

ライブラリ

  1. ライブラリを格納しているフォルダに移動します。
  2. ライブラリ名をクリックします。
  3. 以下のいずれかを実施します。
  • 全てのクラスターにライブラリがインストールされるように設定するには、Install automatically on all clustersチェックボックスを選択し、Confirmをクリックします。

重要!
このオプションはDatabricksランタイム7.0以降が動作しているクラスターにはインストールをしません。

  • ライブラリをインストールするクラスターの隣のチェックボックスを選択し、Installをクリックします。

ライブラリがクラスターにインストールされます。

クラスターライブラリ

ワークスペースライブラリにすることなしに、特定のクラスターにライブラリをインストールすることができます。

  1. サイドバーのComputeをクリックします。
  2. クラスター名をクリックします。
  3. Librariesタブをクリックします。
  4. Install Newをクリックします。
  5. ワークスペースライブラリの作成手順のどれかを実施してください。Createをクリックすると、クラスターにライブラリがインストールされます。

initスクリプト

ライブラリでカスタム設定が必要である場合には、ワークスペースライブラリ、クラスターライブラリインタフェースでライブラリをインストールできない場合があります。この場合には、initスクリプトを使ってインストールすることができます。

クラスターの初期化の際に、DatabricksランタイムクラスターでPythonライブラリのインストールにpiを使用するiniスクリプトの例を示します。

Bash
#!/bin/bash

/databricks/python/bin/pip install astropy

クラスターからライブラリをアンインストールする

注意
クラスターからライブラリをアンインストールする際、クラスターを再起動して初めてライブラリが削除されます。クラスターを再起動するまでは、アンインストールされたライブラリのステータスは、Uninstall pending restartとなります。

クラスター、ライブラリのUIからライブラリのアンインストールをスタートすることができます。

クラスター

  1. サイドバーのComputeをクリックします。
  2. クラスター名をクリックします。
  3. Librariesタブをクリックします。
  4. クラスターの隣にあるチェックボックスで、アンインストールしたいライブラリを選択し、Uninstallをクリックし、Confirmをクリックします。ステータスがUninstall pending restartに変化します。

ライブラリ

  1. ライブラリを格納しているフォルダに移動します。
  2. ライブラリ名をクリックします。
  3. クラスターの隣にあるチェックボックスで、アンインストールしたいライブラリを選択し、Uninstallをクリックし、Confirmをクリックします。ステータスがUninstall pending restartに変化します。
  4. クラスター詳細ページに移動するためにクラスター名をクリックします。

ライブラリをアンインストールするためにRestartConfirmをクリックします。ライブラリはクラスターのLibrariesタブから削除されます。

クラスターにインストールされているライブラリを参照する

  1. サイドバーのComputeをクリックします。
  2. クラスター名をクリックします。
  3. Librariesタブをクリックします。それぞれのライブラリに対して、名前とバージョン、タイプ、インストールのステータス、そして、アップロードされている場合にはソースファイルが表示されます。

クラスターライブラリをアップデートする

クラスターライブラリをアップデートするには、古いバージョンのライブラリをアンインストールし、新規バージョンをインストールします。

Databricks 無料トライアル

Databricks 無料トライアル

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?