LoginSignup
0
0

More than 1 year has passed since last update.

Cluster libraries | Databricks on AWS [2021/7/16時点]の翻訳です。

本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。

クラスターライブラリは、クラスターで稼働しているすべてのノートブックから利用することができます。PyPIやMavenのような公開リポジトリから直接クラスターライブラリをインストールしたり、事前にインストールされたワークスペースライブラリからインストールすることができます。

クラスターにライブラリをインストールする

クラスターにライブラリをインストールするには主に2つの方法があります。

  • すでにワークスペースにアップロードされているワークスペースライブラリをインストールする。
  • 特定のクラスターにのみ使用するライブラリをインストールする。

さらに、ライブラリにカスタムの設定が必要な場合、上述の方法を用いてライブラリをインストールすることができないかもしれません。代わりに、クラスター作成時にinitスクリプトを用いてライブラリをインストールすることができます。

注意
クラスターにライブラリをインストールする際、すでにクラスターにアタッチされているノートブックからはすぐに参照することはできません。最初にノートブックをクラスターからデタッチし、再度アタッチする必要があります。

ワークスペースライブラリ

注意
Databricksランタイム7.2以降では、Databricksはすべてのワークスペースライブラリを、クラスターにインストールされた順番で処理します。Databricksランタイム7.1以前では、MavenとCRANライブラリはクラスターにインストールされた順番で処理されます。

ライブラリ間に依存関係がある場合には、クラスターにインストールする順番に注意を払う必要があるかもしれません。

すでにワークスペースに存在するライブラリをインストールするには、クラスターUIあるいはライブラリUIからスタートすることができます。

クラスター

  1. サイドバーのComputeをクリックします。
  2. クラスター名をクリックします。
  3. Librariesタブをクリックします。
  4. Install Newをクリックします。
  5. Library SourceボタンリストでWorkspaceを選択します。
  6. ワークスペースライブラリを選択します。
  7. Installをクリックします。
  8. すべてのクラスターにライブラリがインストールされるように設定するには、以下を実施します。
    1. ライブラリをクリックします。
    2. Install automatically on all clustersチェックボックスを選択します。
    3. Confirmをクリックします。

ライブラリ

  1. ライブラリを格納しているフォルダに移動します。

  2. ライブラリ名をクリックします。

  3. 以下のいずれかを実施します。

    • すべてのクラスターにライブラリがインストールされるようにするには、Install automatically on all clustersチェックボックスを選択し、Confirmをクリックします。

    重要!
    このオプションはDatabricksランタイム7.0以降が動作しているクラスターにはライブラリをインストールしません。

    • ライブラリをインストールしたいクラスターの隣のチェックボックスを選択し、Installをクリックします。

クラスターにライブラリがインストールされます。

クラスターにインストールされているライブラリ

ワークスペースライブラリとして利用できるようにせずに、特定のクラスターにライブラリをインストールすることができます。

クラスターにライブラリをインストールするには以下を実施します。

  1. サイドバーのComputeをクリックします。
  2. クラスター名をクリックします。
  3. Librariesタブをクリックします。
  4. Install Newをクリックします。
  5. ワークスペースライブラリの作成手順のどれかを実行します。Createをクリックすると、クラスターにライブラリがインストールされます。

initスクリプト

お使いのライブラリがカスタム設定を必要とする場合、ワークスペースライブラリやクラスターライブラリのインタフェースを用いてライブラリをインストールできないかもしれません。代わりに、initスクリプトを用いてライブラリをインストールすることができます。

以下に、クラスター作成時にDatabricksランタイムクラスターにPythonライブラリをインストールするためにpipを使用するinitスクリプトのサンプルを示します。

Bash
#!/bin/bash

/databricks/python/bin/pip install astropy

クラスターからライブラリをアンインストールする

注意
クラスターからライブラリをアンインストールした際、クラスターを再起動した時にのみライブラリは削除されます。クラスターを再起動するまでは、アンインストールされたライブラリのステータスはUninstall pending restartと表示されます。

ライブラリをアンインストールするには、クラスターUIあるいはライブラリUIからスタートすることができます。

クラスター

  1. サイドバーのComputeをクリックします。
  2. クラスター名をクリックします。
  3. Librariesタブをクリックします。
  4. アンインストールしたいライブラリの隣のチェックボックスを選択し、UninstallConfirmをクリックします。ステータスがUninstall pending restartに変化します。

ライブラリ

  1. ライブラリを格納しているフォルダに移動します。
  2. ライブラリ名をクリックします。
  3. アンインストールしたいライブラリがインストールされているクラスターの隣のチェックボックスを選択し、UninstallConfirmをクリックします。ステータスがUninstall pending restartに変化します。
  4. クラスター詳細ページに移動するにはクラスター名をクリックします。

ライブラリをアンインストールするには、RestartConfirmをクリックします。ライブラリがクラスターのLibrariesタブから削除されます。

クラスターにインストールされているライブラリを参照する

  1. サイドバーのComputeをクリックします。
  2. クラスター名をクリックします。
  3. Librariesタブをクリックします。それぞれのライブラリごとに、タブには名前、バージョン、インストールのステータス、そしてアップロードされた場合にはソースファイルが表示されます。

クラスターにインストールされているライブラリをアップデートする

クラスターにインストールされているライブラリをアップデートするには、古いバージョンのライブラリをアンインストールし、新しいバージョンをインストールします。

Databricks 無料トライアル

Databricks 無料トライアル

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0