Databricksクイックスタートガイドのコンテンツです。
Get started as a Databricks Workspace administrator | Databricks on AWS [2021/3/17時点]の翻訳です。
Databricksにようこそ、そして管理者就任おめでとうございます!ここから、世界で最も困難な問題を解決するあなたの旅が始まります。
このスタートガイドは、あなたがDatabricks上でチームを立ち上げられるように、ステップバイステップのガイドを提供するものです。
1. Databricksワークスペースに対する理解を深めます
アカウントを作成し、ユーザーを追加する前にDatabricksに対する理解を深めます。
2. Databricksアカウントを作成し、ワークスペースをデプロイします
あなたはDatabricksのアカウントオーナー(英語)ですか?あなただけがDatabricksアカウントの初期設定を行うことができ、あなたのチームのためのワークスペースをデプロイすることができます。
3. ユーザーを追加し管理者権限を付与します
次にユーザーを追加し、管理者権限を割り当てます。全ての「管理者ユーザー(英語)」が以下のステップを実行することができます:アカウントオーナーである必要はありません。しかし、最初の管理者ユーザーはアカウントオーナーが追加する必要があります。
- ユーザーの追加及び管理者権限の付与
- (オプション)ユーザーをグループに追加(英語)
- (オプション)シングルサインオンのセットアップ(英語)
**この時点で、Databricksワークスペースを利用するための最低限のセットアップが完了しました。**おめでとうございます!実運用環境では、以下の管理者作業に慣れ親しむ必要があります。もし、Databricksを使うのが初めてであるのなら、ユーザー向けスタートガイドを一読いただくのがよろしいかと思います。
4. アクセス権を設定します
ユーザーを追加したあとは、データやDatabricksの機能に対してアクセス権を設定することでデータをよりセキュアにするべきです。このステップを実行するには、Premiumプラン以上が必要となります。
- Databricksにおけるデータガバナンスのベストプラクティスを読みます
- クラスター、ジョブ、テーブル、ノートブック、その他のワークスペースオブジェクトに対するアクセス権を設定します(英語)
- (オプション)S3バケットにクラスターがアクセスできるようにインスタンスプロファイルを設定します
- (オプション)共有クラスターからS3のデータに対して、ユーザーレベルでのアクセスを実現するために、IAMクレディンシャルパススルーを設定します(英語)
5. モニタリングを設定します
あなたのDatabricksにおいて、コストをコントロールし、全てのアクティビティを追跡するために、使用量モニタリングや監査ログを利用したくなるかもしれません。
- 利用量チャートと利用量レポートのダウンロード(英語) (アカウントオーナー)
- 監査ログの有効化(英語) (アカウントオーナー)
6. サポートをセットアップします
Databricksのサポートパッケージを購入いただいているのであれば、ユーザーをサポートの窓口に追加し、サポートプランをどのように管理・利用するのかを知りたくなるかと思います。
7. 上級者向けオプション、ベストプラクティス
これまでのステップを完了したのであれば、セキュアで稼働するDatabricksのデプロイメントが完了したことになります。しかし、以下にあるような上級者向けのオプションやベストプラクティスを学びたくなるかも知れません。
- AWSのネットワーク、セキュリティオプション(英語)
- キャパシティプランニング及びコストのコントロール
- シークレットを用いたセキュアな認証情報管理
- データ保持の管理(英語)
- Delta Lakeを用いたGDPR/CCPAへの準拠(英語)
- HIPAA要件への対応(英語)
- Databricksにおける継続的インテグレーション、デリバリーの設定(英語)
追加のリソース
Databricksアカウントの管理は継続的なプロセスです。管理者ガイド(英語)はアカウントオーナーと管理者ができることを全てカバーしています。Databricksアカウントの能力を最大限に発揮するために、Databricksは様々なリソースを取り揃えています。
Databricksエキスパートになる
- ユーザー向けスタートガイドを学ぶ
- Databricks Academy(英語)でトレーニングを受ける
- docs.databricks.com(英語)のドキュメントを読む
- resources(英語)でe-booksやウェビナーなどを参照する
Apache Sparkを学ぶ
Databricksを説明できるようになる
業界のベストプラクティスを学ぶ
インスピレーションを得る
詳細なベストプラクティスにならう
- continuous integration and delivery on Databricks(英語)を学ぶ
- keep your data lake GDPR and CCPA compliant using Delta Lake(英語)を学ぶ
- migrate workloads to Databricks(英語)を学ぶ
- data governance best practices on Databricks(英語)を学ぶ
- キャパシティプランニング及びコストのコントロールを読む
参加する
- Spark + AI Summit(英語)に参加する
- Ideas Portal(英語)にアイデアを追加し、プロダクトロードマップに影響を与える
ヘルプとサポートを利用する