本書はDatabricksにおけるAWS CodeCommitを用いたバージョン管理で説明しているDatabricks ReposとAWS CodeCommitの連携手順をウォークスルーするものです。
AWSでの設定
Databricks Reposと連携するAWSマネジメントコンソールで設定を行います。
連携用IAMユーザーの作成
Git 認証情報を使用した HTTPS ユーザーのセットアップ - AWS CodeCommitで説明されている手順に従って設定を行います。
- IAMに移動し、ユーザーにアクセスします。
- 連携用のIAMユーザーを作成します。
- **[Grant permissions (アクセス許可の付与)]で、[Attach existing policies directly (既存のポリシーを直接アタッチする)]**を選択します。
- ポリシーAWSCodeCommitPowerUserをアタッチします。
- 作成したユーザーの認証情報タブを開きます。
-
AWS CodeCommit の HTTPS Git 認証情報で認証情報を生成をクリックします。後のステップで使用するので、ここで表示されるユーザー名とパスワードをコピーしておきます。
AWS CodeCommitのレポジトリの作成
- AWS CodeCommitにアクセスします。
- リポジトリをクリックし、リポジトリを作成をクリックします。
- リポジトリ名を指定して作成します。
- URLのクローンのHTTPSをクリックしてURLをコピーします。
Databricksでの設定
- サイドメニューからSettings > User Settingsにアクセスします。
- Git integrationタブを開き、Git providerドロップダウンリストからAWS CodeCommitを選択します。
-
Git provider usernameとHTTPS Git passwordに、連携用IAMユーザーの作成でコピーしておいたユーザー名とパスワードを入力します。
- Saveをクリックします。
Reposでの同期
連携の設定が完了しましたので、CodeCommitのレポジトリとの同期を行います。
- サイドメニューのReposに移動し、自身のユーザー名のフォルダでAdd Repoボタンをクリックします。
- AWS CodeCommitのレポジトリの作成でコピーしたURLをGit repo URLに貼り付けます。
- Createをクリックします。
これでDatabricksとAWS CodeCommitのリポジトリが同期されるようになります。