0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Databricks SQL管理者クイックスタート:Databricks SQLのオンボーディングタスク

Last updated at Posted at 2021-12-28

Admin quickstart: Onboarding tasks for Databricks SQL | Databricks on AWS [2022/8/17時点]の翻訳です。

Databricksクイックスタートガイドのコンテンツです。

本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。

設定不要のDatabricks SQLの機能の概要に関しては、Databricks SQLクイックスタート:サンプルダッシュボードギャラリーからダッシュボードをインポートしてDatabricks SQLを学ぶを参照ください。企業のデータを用いてDatabricks SQLを使い始める前に、管理者はオンボーディングのタスクを完了する必要があります。本書ではこれらのタスクをガイドします。

要件

  • お使いのDatabricksアカウントはプレミアムプラン以上である必要があります。
  • お使いのDatabricksワークスペースはE2バージョンである必要があります。
  • E2ワークスペースの作成方法に関しては、Create and manage workspaces using the account consoleを参照ください。すべての新規Databricksアカウントおよび、ほとんどの既存アカウントは今ではE2となっています。アカウントタイプが不明の場合には、Databricks担当者にお問い合わせください。
  • Databricksの管理者である必要があります。

サイドバーを使用

サイドバーからすべてのDatabricksアセットにアクセスすることができます。サイドバーの中身は選択されたペルソナ:Data Science & EngineeringMachine LearningSQLに依存します。

  • デフォルトではサイドバーは畳まれた状態であり、アイコンのみが表示されています。再度バーにカーソルを移動すると展開することができます。

  • ペルソナを変更するには、Databricksロゴの下のアイコンをクリックし、ペルソナを選択します。

  • 次回ログイン時に表示されるペルソナを固定するには、ペルソナの隣のをクリックします。ピンを外すにはもう一度ピンをクリックします。

  • サイドバーのモードをAuto(デフォルト)、ExpandCollapseに設定するには、サイドバーの下部にあるMenu optionsを使用します。

ステップ1: データアクセスの設定

クラウドストレージにテーブルを格納する場合、データへのアクセスを許可するためのインスタンスプロファイルをDatabricks SQLに設定する必要があります。それぞれのデータベース、テーブル、ビューに対してきめ細かいアクセス権を設定するために、次のステップで標準的なSQL文を使用することができます。

データアクセスの設定手順を完了し、ステップ2: アクセス権の設定に進んでください。

注意
Databricks管理のテーブルを使用している場合は、クラウドストレージへのアクセスを設定する必要はありません。

適切にデータアクセスが設定されると、管理者はデータエクスプローラー(サイドバーのData)を用いて外部テーブルをブラウズすることができます。

ステップ2: アクセス権の設定

Databricks SQLのセキュリティモデルは、GRANT、REVOKEのような標準的なSQL文を用いたきめ細かいアクセス権を設定できるようにSQLデータベースにおいて確立されているセキュリティモデルをベースとしています。

Databricks SQLでは、SQL標準をベースとしたきめ細かいアクセス権を設定するために、テーブルアクセスコントロールを使用します。テーブルアクセスコントロールを用いることで、管理者とオブジェクトの所有者はお使いのデータレイクにおけるエンドツーエンドのセキュリティ、監査可能性を提供する表現豊かな、クラウド非依存、きめ細かいセキュリティモデルを定義することができます。

このステップでは、お使いのアイデンティティプロバイダーと同期されたグループを用いてアクセス権を設定することを強くお勧めします。デフォルトでは、(ステップ1: データアクセスの設定に基づいて)管理者のみが全てのデータを参照できます。データエクスプローラー(サイドバーのData)、あるいはSQLエディタでSQLコマンドを用いることで、アクセスを許可することができます。以下の手順ではデータエクスプローラーを使用します。

  1. サイドバーでDataをクリックします

  2. データエクスプローラーが表示され、デフォルトカタログ(hive_metastore)のデフォルトデータベース(default)のテーブルが表示されます。

    別のデータベースを選択するには、defaultをクリックしデータベースを選択します。

    別のカタログのデータベースを選択するには、hive_metastoreをクリックして別のカタログを選択し、データベースを選択するためにselect databaseをクリックします。

  3. データベース全体のアクセス権を管理するには、Permissionsをクリックします。テーブル、ビューのアクセス権を管理するには、テーブル、ビュー名をクリックしPermissionsをクリックします。

  4. アクセスを許可するにはGrantをクリックします。

    1. ユーザー、グループを入力します。
    2. 許可する一つ以上のアクセス権を選択するか、全てのアクセス権を許可する際にはAllを選択します。
    3. OKをクリックします。
  5. アクセス権を剥奪するには、リストから選択してRevokeをクリックします。

これで、ユーザーやグループがデータを参照、操作するために必要なアクセス権を許可しましたので、ステップ3: SQLウェアハウスの設定に進みます。

ステップ3: SQLウェアハウスの設定

SQLウェアハウス(以前のSQLエンドポイント)は、Databricks環境のデータオブジェクトに対してSQLコマンドを実行する際に用いる計算リソースです。Starter Warehouseと呼ばれる小規模なSQLエンドポイントが作成済みですぐに利用することができます。より複雑なワークロードを取り扱うために、(レーテンシーを削減するために)容易にサイズを増やしたり、(多くの同時アクセスユーザーに対応するために)内部のクラスターの数を増やすことができます。コストを削減するために、スターターウェアハウスは120分のアイドル状態の後に停止するように設定されています。

ワークスペースでサーバーレスコンピュート(ゲーテッドプライベートプレビュー)が有効化されており、サーバーレスSQLエンドポイントを有効化している場合、Serverless Starter Warehouseと呼ばれるサーバーレスSQLウェハウスも自動で作成され、ダッシュボード、ビジュアライゼーション、クエリーに使用することができます。サーバーレスSQLウェアハウスはクラシックなSQLエンドポイントよりも高速に起動し、10分アイドル状態が続くと自動で停止します。

スターターウェアハウスを設定したり、追加のSQLウェアハウスを作成するには、サイドバーのSQL Warehousesをクリックします。詳細はDatabricks SQLウェアハウスとはなんですか?を参照ください。

次のステップ

Databricks 無料トライアル

Databricks 無料トライアル

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?