LoginSignup
0
0

More than 1 year has passed since last update.

Databricks SQL : 管理者向けクイックスタート

Last updated at Posted at 2021-05-24

Quickstart: Set up a user to query a table | Databricks on AWS [2022/8/17時点]の翻訳です。

クイックスタート: クエリーを実行するユーザーのセットアップ

Databricksクイックスタートガイドのコンテンツです。

このクイックスタートでは、ユーザーの作成方法、SQLエンドポイントの作成方法、Databricks datasetから1000万人のレコードを含むテーブルを作成する方法、ユーザーに対するテーブルアクセス権を設定する方法、クエリーを実行する方法、クエリーのランタイムの詳細を説明します。

重要!
Databricks SQLでは、常にデータアクセスコントロールが有効になっていますので、ユーザーは常にデータに対するアクセス権を有している必要があります。

要件

サイドバーの使用

サイドバーからDatabricksの全てのアセットにアクセスできます。サイドバーのコンテンツは選択するペルソナ(Data Science & EngineeringMachine LearningSQL)によって決まります。

  • デフォルトではサイドバーは畳み込まれた状態で表示され、アイコンのみが表示されます。サイドバー上にカーソルを移動すると全体を表示することができます。
  • ペルソナを変更するには、Databricksロゴの直下にあるアイコンからペルソナを選択します。
  • 次回ログイン時に表示されるペルソナを固定するには、ペルソナの隣にあるをクリックします。再度クリックするとピンを削除することができます。
  • サイドバーの一番下にあるMenu optionsで、サイドバーの表示モードを切り替えることができます。Auto(デフォルト)、Expand(展開)、Collapse(畳み込み)から選択できます。

ステップ1: ユーザーの作成

  1. 必要に応じてサイドバーのペルソナを変更してData Science & Engineeringを選択します。

  2. Databricksワークスペースからadmin consoleに移動します。

  3. UsersタブでAdd Userをクリックします。

  4. ユーザーのメールアドレスを入力します。

  5. Send inviteをクリックします。

    Databricksは一時パスワードを含む確認メールを送信します。ユーザーが5分以内にメールを受信しない場合には、ユーザーに迷惑メールとして分類されていない確認してください。

    ワークスペースにユーザーが追加されます。

  6. 必要に応じて、Databricks SQL accessチェックボックスをチェックしてユーザーによるDatabricks SQLへのアクセスを許可します。デフォルトでは新規ワークスペースのすべてのユーザーがこの資格を持ちます。

    注意
    パブリックプレビュー期間中にお使いのワークスペースでDatabricks SQLが有効化されている場合、すなわち2021/7/7の週以前では、変更しない限り、その日以前に割り当てられた資格情報を保持します。言い換えると、パブリックプレビュー期間中にDatabricks SQL accessの資格を有していないユーザーは、管理者が許可しない限り、その権限を持つことはありません。

  7. Confirmをクリックします。

ステップ2: 1000万人のpeopleテーブルを作成する

  1. SQLを選択するためにペルソナスイッチャーを使います。

    ランディングページは以下のようになります。

  2. サイドバーのCreateをクリックし、Queryを選択します。

  3. 左のドロップボックスでStarter WarehouseのようなSQLウェアハウスを選択します。

  4. 以下のクエリーをSQLエディタに貼り付けます。

    SQL
    CREATE TABLE default.people10m OPTIONS (PATH 'dbfs:/databricks-datasets/learning-spark-v2/people/people-10m.delta')
    

    このSQL文によって、Databricksデータセットに格納されているDelta Lakeファイルを使ってDeltaテーブルを作成します。

  5. Ctrl/Cmd + Enterを押すか、Executeボタンをクリックします。このクエリーはNo data was returnedを返します。

  6. スキーマを更新するには、スキーマブラウザの下にあるボタンをクリックします。

  7. データベースの右にあるテキストボックスにpeoと入力します。スキーマブラウザは新たに作成したテーブルを表示します。

ステップ3: default.people10mテーブルに対するアクセス権の設定

ステップ1で作成したユーザーがステップ2で作成したdefault.people10mテーブルにアクセスできるようします。

データエクスプローラSQLエディタを用いてアクセスを設定することができます。

データエクスプローラ

  1. サイドバーのDataをクリックします。
  2. 右上のドロップダウンリストで、Starter WarehouseのようなSQLウェアハウスを選択します。defaultデータベースが選択されます。データベースのコメントとオーナーが表示されます。
  3. defaultデータベースの後のテキストボックスにpeoと入力します。データエクスプローラにpeople10mテーブルが表示されます。
  4. Permissionsタブをクリックします。
  5. Grantボタンをクリックします。
  6. user@example.comを入力します。
  7. USAGEチェックボックスをチェックします。
  8. OKをクリックします。
  9. people10mテーブルをクリックします。
  10. Permissionsタブをクリックします。
  11. Grantボタンをクリックします。
  12. user@example.comを入力します。
  13. SELECTREAD_METADATAチェックボックスをチェックします。
  14. OKをクリックします。

SQLエディタ

  1. サイドバーのCreateをクリックし、Queryを選択します。

  2. 左のドロップボックスでStarter WarehouseのようなSQLウェアハウスを選択します。

  3. 以下のクエリーをSQLエディタに一つづつ貼り付けます。

    SQL
    GRANT USAGE ON DATABASE default TO `user@example.com`;
    
    GRANT SELECT, READ_METADATA ON TABLE default.people10m TO `user@example.com`;
    
    SHOW GRANTS `user@example.com` ON TABLE default.people10m;
    

それぞれのクエリーの後で、Ctrl/Cmd + Enterを押すか、Executeボタンをクリックします。最後のクエリーを実行した後には以下の結果が表示されるはずです。

+------------------+---------------+------------+-----------------------+
| Principal        | ActionType    | ObjectType | ObjectKey             |
+------------------+---------------+------------+-----------------------+
| user@example.com | READ_METADATA | TABLE      | `default`.`people10m` |
+------------------+---------------+------------+-----------------------+
| user@example.com | SELECT        | TABLE      | `default`.`people10m` |
+------------------+---------------+------------+-----------------------+
| user@example.com | USAGE         | DATABASE   | default               |
+------------------+---------------+------------+-----------------------+

ステップ4: クエリーの作成

Databricks SQL: ユーザー向けクイックスタートを修了してください。

ステップ6: クエリー履歴の参照

  1. サイドバーのQuery Historyをクリックします。
  2. クエリーの詳細を参照するには、Query列の文字列をクリックします。

次のステップ

データやテーブルに対するアクセス権の詳細に関しては、Databricks SQLのセキュリティモデルとデータアクセスの概要を参照ください。

どのようにアクセスを有効化するのかを学ぶために、https://<databricks-instance>/sqlにアクセスしてください。<databricks-instance>dbc-a1b2345c-d6e7.cloud.databricks.comのようなお使いのワークスペースインスタンス名で置き換えてください。

Databricks 無料トライアル

Databricks 無料トライアル

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0