More than 3 years have passed since last update.

データブリックス・ジャパン株式会社

Databricksコンテナサービスによるコンテナのカスタマイズ

Posted at 2022-06-02

Customize containers with Databricks Container Services | Databricks on AWS [2022/5/30時点]

本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。

Databricksコンテナサービスを使うことで、クラスターを作成する際にDockerイメージを指定することができます。以下のようなユースケースが考えられます。

ライブラリのカスタマイズ: インストールされるシステムライブラリに対して完全なコントロールを持つことができます。
ゴールデンコンテナ環境: お使いのDockerイメージが決して変更されないロックダウン環境となります。
Docker CI/CDインテグレーション: お使いのDocker CI/CDパイプラインを用いてDatabricksとインテグレーションすることができます。

また、GPUデバイスを持つクラスター上のカスタムディープラーニング環境を作るためにDockerイメージを使うことができます。DatabricksコンテナサービスによるGPUクラスターの活用に関しては、Databricks Container Services on GPU clustersをご覧ください。

コンテナが起動するたびに実行されるタスクに関しては、initスクリプトを使います。

要件

注意
Databricks機械学習ランタイムとDatabricks Runtime for GenomicsはDatabricksコンテナサービスをサポートしていません。

Databricksランタイム6.1以降。以前にDatabricksコンテナサービスを使ったことがある場合、ベースイメージをアップグレードする必要があります。最新のイメージに関しては、 https://github.com/databricks/containers で6.xとタグづけされているものを参照ください。
お使いのDatabricksワークスペースでDatabricks Container Servicesが有効化されている必要があります。
お使いのマシンでは最新のDocker daemon(Client/Server Version 18.03.0-ceでの動作確認がされています)が稼働しており、ご自身のPATHでdockerコマンドが使用できる必要があります。

ステップ1: ベースを作成する

Databricksがビルド、テストしたDockerベースをビルドすることをお勧めします。最初からご自身でDockerベースをビルドすることも可能です。このセクションではこれら2つのオプションを説明します。

オプション1: Databricksによってビルドされたベースを使う

このサンプルでは、Databricksランタイム9.0以降が稼働するクラスターをターゲットにする9.xタグを使用します。

Bash

FROM databricksruntime/standard:9.x
...

最新のpandasやurllibのような追加のPythonライブラリを指定するには、コンテナ固有バージョンのpipを使用します。datatabricksruntime/standard:9.xコンテナにおいては、以下を含めます。

Bash

RUN /databricks/python3/bin/pip install pandas
RUN /databricks/python3/bin/pip install urllib3

datatabricksruntime/standard:8.x以前のコンテナに関しては、以下を含めます。

Bash

RUN /databricks/conda/envs/dcs-minimal/bin/pip install pandas
RUN /databricks/conda/envs/dcs-minimal/bin/pip install urllib3

サンプルのベースイメージは、Docker Hubの https://hub.docker.com/u/databricksruntime でホストされています。これらのベースを生成するために使用されたDockerfilesは https://github.com/databricks/containers にあります。

注意
ベースイメージdatabricksruntime/standardとdatabricksruntime/minimalを、関係のないdatabricks-standardやdatabricks-minimal環境と混同しないでください。これらは、もはや利用できないDatabricks Runtime with Conda (Beta)に含まれるものです。

オプション2: 自分でDockerベースをビルドする

最初から自身でDockerベースをビルドすることもできます。Dockerイメージは以下の要件を満たす必要があります。

JDK 8u191 as Java on the system PATH
bash
iproute2 (ubuntu iproute)
coreutils (ubuntu coreutils)
procps (ubuntu procps)
sudo (ubuntu sudo)
Ubuntu Linux

自分で最初からイメージをビルドするためには、仮想環境を作成する必要があります。また、Python、R、GangliaなどDatabricksクラスターに含まれているパッケージを含める必要もあります。スタートするために、適切なベースイメージ(R向けのdatabricksruntime/rbaseやPython向けのdatabricksruntime/python)を使用したり、Dockerfiles in GitHubのサンプルを参照することができます。別の選択肢は、Databricksによってビルドされたミニマルのイメージdatabricksruntime/minimalからスタートするというものです。

注意
Ubuntu Linuxを使用することをお勧めします。しかし、Alpine Linuxを使うことも可能です。Alpine Linuxを使用するには、以下のファイルを含める必要があります。

さらに、こちらのexample Dockerfileにあるように、Pythonをセットアップする必要があります。

警告
あなたのカスタムコンテナイメージをDatabricksクラスターで完全にテストしてください。ローカルあるいはビルドしたマシンでコンテナは動作するかもしれませんが、Databricksクラスターでコンテナが起動された際、クラスターが失敗する場合があり、特定の機能が利用不可となるから、場合によってはメッセージもなしにコンテナが動作を停止するかもしれません。最悪のシナリオでは、データを破壊したり、意図せずデータを外部に公開してしまうかもしれません。

念のためですが、Databricksサービスコンテナの利用はService Specific Termsの対象となります。

ステップ2: ベースイメージをプッシュする

カスタムベースイメージをDockerレジストリにプッシュします。このプロセスは以下のレジストリでサポートされています。

認証なし、あるいはbasic認証のDocker Hub
IAMが設定された(Commercial Cloud Services (C2S)は例外)、Amazon Elastic Container Registry (Amazon ECR)
basic認証のAzure Container Registry

認証なし、basic認証の他のDockerレジストリも動作すると思われます。

注意
DockerレジストリにDocker Hubを使っている場合、6時間の間に起動されることが予想されるクラスター数とレート制限が合致していることをチェックするようにしてください。これらのレート制限は、匿名ユーザー、有料サブスクリプションなしの認証ユーザー、有料サブスクリプションによって異なります。詳細はthe Docker documentationをご覧ください。この制限を超えると、429 Too Many Requestsが返却されます。

ステップ3: クラスターを起動する

UIあるいはAPIを用いてクラスターを起動することができます。

UIを使ってクラスターを起動する

DatabricksコンテナサービスをサポートするDatabricksランタイムバージョンを指定します。
Use your own Docker containerを選択します。

Docker Image URLフィールドにご自身のカスタムDockerイメージを入力します。

DockerイメージURLのサンプル:

レジストリ	タグのフォーマット
Docker Hub	`<organization>/<repository>:<tag>` (例えば `databricksruntime/standard:latest`)
Amazon ECR	`<aws-account-id>.dkr.ecr.<region>.amazonaws.com/<repository>:<tag>`
Azure Container Registry	`<your-registry-name>.azurecr.io/<repository-name>:<tag>`

認証タイプを選択します。

APIを使ってクラスターを起動する

APIのトークンを生成します。
ご自身のカスタムDockerベースを用いてクラスターを起動するためにClusters API 2.0を使います。
Bash
```
curl -X POST -H "Authorization: Bearer <token>" https://<databricks-instance>/api/2.0/clusters/create -d '{
  "cluster_name": "<cluster-name>",
  "num_workers": 0,
  "node_type_id": "i3.xlarge",
  "docker_image": {
    "url": "databricksruntime/standard:latest",
    "basic_auth": {
      "username": "<docker-registry-username>",
      "password": "<docker-registry-password>"
    }
  },
  "spark_version": "7.3.x-scala2.12",
  "aws_attributes": {
    "availability": "ON_DEMAND",
    "instance_profile_arn": "arn:aws:iam::<aws-account-number>:instance-profile/<iam-role-name>"
  }
}'
```
basic_authの要件はお使いのDockerイメージタイプに依存します。
- パブリックなDockerイメージの場合、basic_authフィールドを含めないでください。
- プライベートなDockerイメージの場合、ユーザー名とパスワードとしてサービスプリンシパルIDとパスワードを用いたbasic_authフィールドを含める必要があります。
- Azure Container Registryの場合、サービスプリンシパルのIDとパスワードに対応するbasic_authフィールドを設定する必要があります。サービスプリンシパルの作成方法に関しては、Azure Container Registry service principal authentication documentationをご覧ください。
- Amazon ECRイメージの場合、basic_authフィールドを含めないでください。イメージが存在するDockerリポジトリからDockerイメージをプルする権限を含むインスタンスプロファイルを設定してクラスターを起動する必要があります。このためには、インスタンスプロファイルを用いたS3バケットへのセキュアなアクセスのセットアップのステップ3からステップ5の手順に従ってください。
任意のイメージをプルする権限を持つIAMロールのサンプルです。リポジトリは<arn-of-repository>で指定します。
JSON
```
 {
   "Version": "2012-10-17",
   "Statement": [
     {
       "Effect": "Allow",
       "Action": [
           "ecr:GetAuthorizationToken"
       ],
     "Resource": "*"
   },
   {
     "Effect": "Allow",
     "Action": [
         "ecr:BatchCheckLayerAvailability",
         "ecr:GetDownloadUrlForLayer",
         "ecr:GetrepositoryPolicy",
         "ecr:DescribeRepositories",
         "ecr:ListImages",
         "ecr:DescribeImages",
         "ecr:BatchGetImage"
       ],
       "Resource": [ "<arn-of-repository>" ]
     }
   ]
 }
```
Amazon ECRイメージがDatabricksクラスターと異なるAWSアカウントに存在している場合、Databricksクラスターのアクセスを許可するためにクラスターのインスタンスプロファイルに加えて、ECR repository policyを使います。ECRリポジトリポリシーのサンプルを示します。<arn-of-IAM-role>で指定されたクラスターのインスタンスプロファイルにIAMポリシーの権限が移譲されます。
JSON
```
{
  "Version": "2012-10-17",
  "Statement": [{
    "Sid": "AllowCrossAccountPush",
    "Effect": "Allow",
    "Principal": {
      "AWS": "<arn-of-IAM-role>"
    },
    "Action": [
      "ecr:BatchCheckLayerAvailability",
      "ecr:BatchGetImage",
      "ecr:DescribeImages",
      "ecr:DescribeRepositories",
      "ecr:GetDownloadUrlForLayer",
      "ecr:GetrepositoryPolicy",
      "ecr:ListImages"
    ]
  }]
}
```

initスクリプトを使う

Databricksコンテナサービスのクラスターでは、Dockerコンテナにinitスクリプトを含めることができます。多くの場合、initスクリプトを使用するのではなく、(Dockerfileを用いて)直接Dockerのカスタマイズをすべきです。しかし、コンテナがビルドされるときではなく、コンテナが起動する際に特定のタスクが実行される必要があるケースがあります。これらのタスクに関してはinitスクリプトを使います。

例えば、カスタムコンテナ内でセキュリティdaemonを動作させたいとします。イメージビルドのパイプラインを通じて、Dockerイメージにdaemonをインストール・ビルドします。次に、daemonを起動するinitスクリプトを追加します。この例では、initスクリプトにはsystemctl start my-daemonのような行が追加されます。

APIでは、以下のようにクラスターの仕様の一部としてinitスクリプトを指定することができます。詳細はInitScriptInfoをご覧ください。

JSON

"init_scripts": [
    {
        "file": {
            "destination": "file:/my/local/file.sh"
        }
    }
]

Databricksコンテナサービスイメージにおいては、initスクリプトをDBFSあるいはクラウドストレージに格納することもできます。

Databricksコンテナサービスクラスターを起動する際に以下のステップが実行されます。

クラウドプロバイダーからVMを取得します。
カスタムDockerイメージがお使いのリポジトリからダウンロードされます。
DatabricksがイメージからDockerコンテナを作成します。
DockerコンテナにDatabricksランタイムのコードがコピーされます。
initスクリプトが実行されます。initスクリプトの実行順序をご覧ください。

DatabricksはDockerのCMDとENTRYPOINTプリミティブは無視します。

Databricks 無料トライアル

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up