Admin quickstart: Onboarding tasks for Databricks SQL | Databricks on AWS [2022/8/17時点]の翻訳です。
Databricksクイックスタートガイドのコンテンツです。
本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
設定不要のDatabricks SQLの機能の概要に関しては、Databricks SQLクイックスタート:サンプルダッシュボードギャラリーからダッシュボードをインポートしてDatabricks SQLを学ぶを参照ください。企業のデータを用いてDatabricks SQLを使い始める前に、管理者はオンボーディングのタスクを完了する必要があります。本書ではこれらのタスクをガイドします。
要件
- お使いのDatabricksアカウントはプレミアムプラン以上である必要があります。
- お使いのDatabricksワークスペースはE2バージョンである必要があります。
- E2ワークスペースの作成方法に関しては、Create and manage workspaces using the account consoleを参照ください。すべての新規Databricksアカウントおよび、ほとんどの既存アカウントは今ではE2となっています。アカウントタイプが不明の場合には、Databricks担当者にお問い合わせください。
- Databricksの管理者である必要があります。
サイドバーを使用
サイドバーからすべてのDatabricksアセットにアクセスすることができます。サイドバーの中身は選択されたペルソナ:Data Science & Engineering、Machine Learning、SQLに依存します。
-
デフォルトではサイドバーは畳まれた状態であり、アイコンのみが表示されています。再度バーにカーソルを移動すると展開することができます。
-
次回ログイン時に表示されるペルソナを固定するには、ペルソナの隣のをクリックします。ピンを外すにはもう一度ピンをクリックします。
-
サイドバーのモードをAuto(デフォルト)、Expand、Collapseに設定するには、サイドバーの下部にあるMenu optionsを使用します。
ステップ1: データアクセスの設定
クラウドストレージにテーブルを格納する場合、データへのアクセスを許可するためのインスタンスプロファイルをDatabricks SQLに設定する必要があります。それぞれのデータベース、テーブル、ビューに対してきめ細かいアクセス権を設定するために、次のステップで標準的なSQL文を使用することができます。
データアクセスの設定手順を完了し、ステップ2: アクセス権の設定に進んでください。
注意
Databricks管理のテーブルを使用している場合は、クラウドストレージへのアクセスを設定する必要はありません。
適切にデータアクセスが設定されると、管理者はデータエクスプローラー(サイドバーのData)を用いて外部テーブルをブラウズすることができます。
ステップ2: アクセス権の設定
Databricks SQLのセキュリティモデルは、GRANT、REVOKEのような標準的なSQL文を用いたきめ細かいアクセス権を設定できるようにSQLデータベースにおいて確立されているセキュリティモデルをベースとしています。
Databricks SQLでは、SQL標準をベースとしたきめ細かいアクセス権を設定するために、テーブルアクセスコントロールを使用します。テーブルアクセスコントロールを用いることで、管理者とオブジェクトの所有者はお使いのデータレイクにおけるエンドツーエンドのセキュリティ、監査可能性を提供する表現豊かな、クラウド非依存、きめ細かいセキュリティモデルを定義することができます。
このステップでは、お使いのアイデンティティプロバイダーと同期されたグループを用いてアクセス権を設定することを強くお勧めします。デフォルトでは、(ステップ1: データアクセスの設定に基づいて)管理者のみが全てのデータを参照できます。データエクスプローラー(サイドバーのData)、あるいはSQLエディタでSQLコマンドを用いることで、アクセスを許可することができます。以下の手順ではデータエクスプローラーを使用します。
-
サイドバーでDataをクリックします
-
データエクスプローラーが表示され、デフォルトカタログ(
hive_metastore
)のデフォルトデータベース(default
)のテーブルが表示されます。別のデータベースを選択するには、defaultをクリックしデータベースを選択します。
別のカタログのデータベースを選択するには、hive_metastoreをクリックして別のカタログを選択し、データベースを選択するためにselect databaseをクリックします。
-
データベース全体のアクセス権を管理するには、Permissionsをクリックします。テーブル、ビューのアクセス権を管理するには、テーブル、ビュー名をクリックしPermissionsをクリックします。
-
アクセスを許可するにはGrantをクリックします。
- ユーザー、グループを入力します。
- 許可する一つ以上のアクセス権を選択するか、全てのアクセス権を許可する際にはAllを選択します。
- OKをクリックします。
-
アクセス権を剥奪するには、リストから選択してRevokeをクリックします。
これで、ユーザーやグループがデータを参照、操作するために必要なアクセス権を許可しましたので、ステップ3: SQLウェアハウスの設定に進みます。
ステップ3: SQLウェアハウスの設定
SQLウェアハウス(以前のSQLエンドポイント)は、Databricks環境のデータオブジェクトに対してSQLコマンドを実行する際に用いる計算リソースです。Starter Warehouseと呼ばれる小規模なSQLエンドポイントが作成済みですぐに利用することができます。より複雑なワークロードを取り扱うために、(レーテンシーを削減するために)容易にサイズを増やしたり、(多くの同時アクセスユーザーに対応するために)内部のクラスターの数を増やすことができます。コストを削減するために、スターターウェアハウスは120分のアイドル状態の後に停止するように設定されています。
ワークスペースでサーバーレスコンピュート(ゲーテッドプライベートプレビュー)が有効化されており、サーバーレスSQLエンドポイントを有効化している場合、Serverless Starter Warehouseと呼ばれるサーバーレスSQLウェハウスも自動で作成され、ダッシュボード、ビジュアライゼーション、クエリーに使用することができます。サーバーレスSQLウェアハウスはクラシックなSQLエンドポイントよりも高速に起動し、10分アイドル状態が続くと自動で停止します。
スターターウェアハウスを設定したり、追加のSQLウェアハウスを作成するには、サイドバーのSQL Warehousesをクリックします。詳細はDatabricks SQLウェアハウスとはなんですか?を参照ください。
次のステップ
- Databricks SQLクイックスタート:サンプルダッシュボードギャラリーからダッシュボードをインポートしてDatabricks SQLを学ぶ
- Databricks SQL : 管理者向けクイックスタートの次ステップとなるDatabricks SQL : ユーザー向けクイックスタートをトライしてみてください。
- Databricks SQLのセキュリティモデルとデータアクセスの概要の詳細をご覧ください。