More than 1 year has passed since last update.

Databricks SQL管理者クイックスタート：Databricks SQLのオンボーディングタスク

Last updated at 2022-08-28Posted at 2021-12-28

Admin quickstart: Onboarding tasks for Databricks SQL | Databricks on AWS [2022/8/17時点]の翻訳です。

Databricksクイックスタートガイドのコンテンツです。

本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。

設定不要のDatabricks SQLの機能の概要に関しては、Databricks SQLクイックスタート：サンプルダッシュボードギャラリーからダッシュボードをインポートしてDatabricks SQLを学ぶを参照ください。企業のデータを用いてDatabricks SQLを使い始める前に、管理者はオンボーディングのタスクを完了する必要があります。本書ではこれらのタスクをガイドします。

要件

お使いのDatabricksアカウントはプレミアムプラン以上である必要があります。
お使いのDatabricksワークスペースはE2バージョンである必要があります。
E2ワークスペースの作成方法に関しては、Create and manage workspaces using the account consoleを参照ください。すべての新規Databricksアカウントおよび、ほとんどの既存アカウントは今ではE2となっています。アカウントタイプが不明の場合には、Databricks担当者にお問い合わせください。
Databricksの管理者である必要があります。

サイドバーを使用

サイドバーからすべてのDatabricksアセットにアクセスすることができます。サイドバーの中身は選択されたペルソナ:Data Science & Engineering、Machine Learning、SQLに依存します。

デフォルトではサイドバーは畳まれた状態であり、アイコンのみが表示されています。再度バーにカーソルを移動すると展開することができます。
ペルソナを変更するには、Databricksロゴの下のアイコンをクリックし、ペルソナを選択します。
次回ログイン時に表示されるペルソナを固定するには、ペルソナの隣のをクリックします。ピンを外すにはもう一度ピンをクリックします。
サイドバーのモードをAuto(デフォルト)、Expand、Collapseに設定するには、サイドバーの下部にあるMenu optionsを使用します。

ステップ1: データアクセスの設定

クラウドストレージにテーブルを格納する場合、データへのアクセスを許可するためのインスタンスプロファイルをDatabricks SQLに設定する必要があります。それぞれのデータベース、テーブル、ビューに対してきめ細かいアクセス権を設定するために、次のステップで標準的なSQL文を使用することができます。

データアクセスの設定手順を完了し、ステップ2: アクセス権の設定に進んでください。

注意
Databricks管理のテーブルを使用している場合は、クラウドストレージへのアクセスを設定する必要はありません。

適切にデータアクセスが設定されると、管理者はデータエクスプローラー(サイドバーのData)を用いて外部テーブルをブラウズすることができます。

ステップ2: アクセス権の設定

Databricks SQLのセキュリティモデルは、GRANT、REVOKEのような標準的なSQL文を用いたきめ細かいアクセス権を設定できるようにSQLデータベースにおいて確立されているセキュリティモデルをベースとしています。

Databricks SQLでは、SQL標準をベースとしたきめ細かいアクセス権を設定するために、テーブルアクセスコントロールを使用します。テーブルアクセスコントロールを用いることで、管理者とオブジェクトの所有者はお使いのデータレイクにおけるエンドツーエンドのセキュリティ、監査可能性を提供する表現豊かな、クラウド非依存、きめ細かいセキュリティモデルを定義することができます。

このステップでは、お使いのアイデンティティプロバイダーと同期されたグループを用いてアクセス権を設定することを強くお勧めします。デフォルトでは、(ステップ1: データアクセスの設定に基づいて)管理者のみが全てのデータを参照できます。データエクスプローラー(サイドバーのData)、あるいはSQLエディタでSQLコマンドを用いることで、アクセスを許可することができます。以下の手順ではデータエクスプローラーを使用します。

サイドバーでDataをクリックします
データエクスプローラーが表示され、デフォルトカタログ(hive_metastore)のデフォルトデータベース(default)のテーブルが表示されます。

別のデータベースを選択するには、defaultをクリックしデータベースを選択します。

別のカタログのデータベースを選択するには、hive_metastoreをクリックして別のカタログを選択し、データベースを選択するためにselect databaseをクリックします。
データベース全体のアクセス権を管理するには、Permissionsをクリックします。テーブル、ビューのアクセス権を管理するには、テーブル、ビュー名をクリックしPermissionsをクリックします。
アクセスを許可するにはGrantをクリックします。
1. ユーザー、グループを入力します。
2. 許可する一つ以上のアクセス権を選択するか、全てのアクセス権を許可する際にはAllを選択します。
3. OKをクリックします。
アクセス権を剥奪するには、リストから選択してRevokeをクリックします。

これで、ユーザーやグループがデータを参照、操作するために必要なアクセス権を許可しましたので、ステップ3: SQLウェアハウスの設定に進みます。

ステップ3: SQLウェアハウスの設定

SQLウェアハウス(以前のSQLエンドポイント)は、Databricks環境のデータオブジェクトに対してSQLコマンドを実行する際に用いる計算リソースです。Starter Warehouseと呼ばれる小規模なSQLエンドポイントが作成済みですぐに利用することができます。より複雑なワークロードを取り扱うために、(レーテンシーを削減するために)容易にサイズを増やしたり、(多くの同時アクセスユーザーに対応するために)内部のクラスターの数を増やすことができます。コストを削減するために、スターターウェアハウスは120分のアイドル状態の後に停止するように設定されています。

ワークスペースでサーバーレスコンピュート(ゲーテッドプライベートプレビュー)が有効化されており、サーバーレスSQLエンドポイントを有効化している場合、Serverless Starter Warehouseと呼ばれるサーバーレスSQLウェハウスも自動で作成され、ダッシュボード、ビジュアライゼーション、クエリーに使用することができます。サーバーレスSQLウェアハウスはクラシックなSQLエンドポイントよりも高速に起動し、10分アイドル状態が続くと自動で停止します。

スターターウェアハウスを設定したり、追加のSQLウェアハウスを作成するには、サイドバーのSQL Warehousesをクリックします。詳細はDatabricks SQLウェアハウスとはなんですか？を参照ください。

次のステップ

Databricks SQLクイックスタート：サンプルダッシュボードギャラリーからダッシュボードをインポートしてDatabricks SQLを学ぶ
Databricks SQL : 管理者向けクイックスタートの次ステップとなるDatabricks SQL : ユーザー向けクイックスタートをトライしてみてください。
Databricks SQLのセキュリティモデルとデータアクセスの概要の詳細をご覧ください。

Databricks 無料トライアル

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up