LoginSignup
1
1

More than 1 year has passed since last update.

Databricksアカウントコンソールを用いたPrivateLink構成ワークスペースのデプロイメント

Last updated at Posted at 2022-11-23

AWSでDatabricksのワークスペースをデプロイする際、AWSのPrivateLinkを用いた構成を組むことができます。

最近まではREST APIを呼び出してデプロイを行う必要があり正直大変でしたが、最近ではDatabricksアカウントコンソールでデプロイができる様になっているので、ここではそのデプロイ方法をウォークスルーします。

REST APIを用いたデプロイに関してはこちらに記載しています(古くなっているので時間がある時にアップデートしたいところですが)。

AWS側の設定

  1. こちらの手順に沿って、クロスアカウントIAMロール、S3バケットの設定を行います。
  2. こちらの手順に沿って顧客管理VPCを作成します。
  3. 以前はVPCエンドポイントの有効化を行う際、Databricksへの連絡が必要でしたが今では不要です。こちらの手順に沿って必要なVPCエンドポイントを作成します。AWSのコンソールが当時から若干変わっているので、以下にスクリーンショットを載せます。
    1. VPC > エンドポイント > エンドポイントの作成に移動します。
      Screen Shot 2022-11-23 at 11.40.47.png
    2. 名前(Workspace VPC endpoint serviceなど用途がわかるもの)を指定し、その他のエンドポイントサービスを選択し、サービス名にはこちらに記載されている当該リージョンのエンドポイントサービス(東京リージョンならcom.amazonaws.vpce.ap-northeast-1.vpce-svc-02691fd610d24fd64)を指定します。
    3. サービスの検証をクリックします。サービス名が検証されました。 と表示されることを確認します。
      Screen Shot 2022-11-23 at 11.45.24.png
    4. VPCは上で作成したVPC、サブネットはVPCエンドポイント向けサブネットを選択します。
      Screen Shot 2022-11-23 at 11.46.43.png
    5. セキュリティグループはVPCエンドポイント向けセキュリティグループを選択し、エンドポイントを作成をクリックします。
      Screen Shot 2022-11-23 at 11.47.30.png
  4. Back-end SCC relay serviceのエンドポイントサービスについても同様の手順で作成します。これらのステータスは最初は保留中となりますが、しばらく待つと使用可能になります。以前はエンドポイントの登録作業が必要でしたが今は不要です。また、こちらの手順に沿って、VPCエンドポイントのプライベートDNS名を有効化することを忘れない様にしてください。
    Screen Shot 2022-11-23 at 12.07.21.png
  5. こちらの手順に沿ってS3、STS、Kinesisのエンドポイント、こちらの手順でGlueのエンドポイントを作成します。
    1. S3エンドポイントは以下の様に作成します。ルートテーブルはメインルートテーブルを選択します。
      Screen Shot 2022-11-23 at 11.51.29.png
  6. ここまでの作業を行うと以下の様にエンドポイントが作成されます。
    Screen Shot 2022-11-23 at 12.12.16.png

次のステップで使用するので、以下の情報をメモしておきます。

  • 作成したVPCのVPC ID
    Screen Shot 2022-11-23 at 12.24.16.png
  • ワークスペース用に作成した二つのサブネットのサブネットID
    Screen Shot 2022-11-23 at 12.26.43.png
  • ワークスペース用セキュリティグループのセキュリティID
    Screen Shot 2022-11-23 at 12.27.11.png
  • Workspace VPC endpoint serviceエンドポイントのエンドポイントID
  • Back-end SCC relay serviceエンドポイントのエンドポイントID
    Screen Shot 2022-11-23 at 12.27.30.png

Databricksアカウントコンソールの設定

以前は、REST APIをコールして行ってワークスペースをデプロイしていましたが、今では以降の作業はGUIで行うことができます(APIを使うことも可能です。作業記録を残すという観点ではAPIを使った方がいいケースもあると思います)。

  1. アカウントコンソールにログインします。Create workspaceをクリックします。
    Screen Shot 2022-11-23 at 12.15.08.png

  2. ワークスペース名、URL、リージョン、Credential configuration、Storage configurationを指定します。
    Screen Shot 2022-11-23 at 12.19.12.png

  3. Advanced configurationsを展開します。
    Screen Shot 2022-11-23 at 12.20.46.png
    Screen Shot 2022-11-23 at 12.21.30.png

  4. Network configurationのドロップダウンを展開し、Add a new network configuraionを選択します。
    Screen Shot 2022-11-23 at 12.21.47.png

  5. ダイアログが表示されるので、ネットワーク設定情報名を入力します。そして、上のステップの最後にメモしたVPC ID、サブネットID、セキュリティグループIDを入力します。
    Screen Shot 2022-11-23 at 12.32.44.png

  6. 下にダイアログをスクロールし、Back-end private connectivityを表示させます。
    Screen Shot 2022-11-23 at 12.34.26.png

  7. VPC endpoint for secure cluster connectivity relayのドロップダウンをクリックし、Add a new VPC endpointを選択します。
    Screen Shot 2022-11-23 at 12.34.55.png

  8. さらにダイアログが表示されるので、VPCエンドポイント名、リージョン、そして上のステップでメモしたBack-end SCC relay serviceエンドポイントのエンドポイントIDを入力します。

    重要!
    Workspace VPC endpoint serviceエンドポイントと混同しない様にしてください。

    Screen Shot 2022-11-23 at 12.36.22.png

  9. Register new VPC endpointをクリックして登録します。

  10. Workspace VPC endpoint serviceエンドポイントについても同様の手順で登録します。

  11. このように適切なエンドポイントが選択されていることを確認し、Addをクリックします。これでネットワーク設定オブジェクトが作成されます。
    Screen Shot 2022-11-23 at 12.39.46.png

  12. Private Linkに移動し、Add a new private access settingをクリックします。
    Screen Shot 2022-11-23 at 12.40.39.png

  13. ダイアログが表示されるので、設定名、リージョン、Public access、Private Access Levelを設定します。特にPublic accessに関しては、フロントエンドPrivateLinkと組み合わせた完全ロックダウン構成以外のケースではTrueを選択してください。公衆ネットワークからログインしようとしてもエラーになってしまいます。Private Access Levelも特別な理由がなければAccountを選択します。Add private access settingをクリックして設定を作成します。
    Screen Shot 2022-11-23 at 12.44.21.png

  14. これまで設定した内容が画面に反映されていることを確認して、SaveをクリックすればDatabricksワークスペースのデプロイメントが開始します。
    Screen Shot 2022-11-23 at 12.45.04.png
    Screen Shot 2022-11-23 at 12.46.11.png

  15. StatusがRunningになればワークスペースにアクセスできます。
    Screen Shot 2022-11-23 at 12.48.22.png

動作確認

  1. 最初はアカウントオーナーでログインします。
    Screen Shot 2022-11-23 at 12.49.31.png
  2. 規模の小さいクラスターを作成して起動します。
    Screen Shot 2022-11-23 at 12.51.18.png
  3. クラスターが起動すれば問題なしです!
    Screen Shot 2022-11-23 at 13.03.21.png

Databricks 無料トライアル

Databricks 無料トライアル

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1