2
1

More than 1 year has passed since last update.

Databricks SQL: データレイクでプロダクションSQL開発体験を

Last updated at Posted at 2021-10-02

Databricks SQL: Delivering a Production SQL Development Experience on the Data Lake - The Databricks Blogの翻訳です。

Databricks SQL(DB SQL)は、クラウドデータウェアハウスの一部のコストで利用できる、洞察の抽出、共有のためのシンプルかつパワフルなSQL分析プラットフォームです。データアナリストは、お使いのビジネスインテリジェンス(BI)ツールからSQLエンドポイントに接続するか、ビルトインの分析機能(SQLクエリーエディタ、可視化、ダッシュボード)を活用するか、両方を組み合わせて使用することができます。今では、多くのお客様はデータレイク上で直接分析、レポーティングを行うためにTableau、Microsoft Power BIなどお使いのBIツールからDB SQLに接続しています。サードパーティのBIツールのサポートに加えて、DB SQLは追加のツールなしに迅速な探索や軽量なレポートを行うために必要なすべてを備えています。

この記事はDatabricks SQLのパフォーマンス、使いやすさ、ガバナンスに関する重要な機能をカバーするブログシリーズの一つです。こちらでは、以下にしめす、ユーザーエクスペリエンスの改善をハイライトします。

  • サンプルデータ、ダッシュボードによる迅速なオンボーディング
  • データの発見とアクセス管理
  • SQLクエリーエディタによる生産性の改善
  • ダッシュボードのサブスクライブ
  • クエリー結果に基づくアラート

サンプルデータ、ダッシュボードによる迅速なオンボーディング

Databricks SQLは、追加のライセンスを購入することなしに、アナリスト、データサイエンティストからエンジニア、プロダクトマネージャが重要な洞察を迅速に得ることができるツールを提供します。お客様の組織にいる多くの人がSQLに慣れ親しんでいるかもしれませんが、DB SQLの可視化、ダッシュボードの詳細に慣れ親しんではいないかもしれません。新規ユーザーが容易にオンボーディングできるように、Databricks SQLはサンプルデータ、クエリー、可視化、ダッシュボードをすぐに利用できるようにしています。

ダッシュボードギャラリーを訪れれば、Databricksが提供するダッシュボードを確認でき、自身のワークスペースにインポートすることができます。これらのサンプルは、異なる閾値に基づきフォントカラーを変化させたりするような一般的な可視化タイプと設定を説明します。

Databricks SQL ダッシュボードの説明動画 from Databricks on Vimeo.

データの発見とアクセス管理

今となっては、企業のデータランドスケープが数十、数百、数千のデータセットを含むことは珍しいことではありません。どのようなデータが利用できるのか、誰がどのデータベース・テーブルにアクセスのかといったことを明らかにすること自体、大変なことになっています。データエクスプローラーは利用可能なデータセット、テーブル、ビューを検索し、そしてデータのアクセス権を管理するためのスタート地点となります。

Databricks SQLにおいて、データエクスプローラーは利用可能なデータを一覧し、アクセス権を管理するための直感的なインタフェースを提供します。これはあなたの企業において、信頼できる高品質なデータをセキュアにするための最初の一歩となります。

Databricks SQLのデータエクスプローラーの説明動画 from Databricks on Vimeo.

SQLクエリーエディタによる生産性の改善

あなたのビジネスを本当に理解するためには、SELECT *のはるか先を行かなくてはなりません。ビジネス上の疑問に対する答えを包括的に理解するためには、多角的観点殻問題を捉え、先に進むに従ってそれを洗練していく必要があります。Databricks SQLはあなたが生産性高く複数のクエリーを同時に繰り返すのに必要となる、SQL開発エクスペリエンスを提供します。

  • マルチタスク実行者の喜び - クエリータブを用いることで同じ画面上でクエリー間を行ったり来たりすることが容易になります!
  • ドラフトの自動保存。クエリーを失うことなしにブラザーを閉じることができます。
  • 適切な提案によるオートコンプリートの活用。
  • すぐに参照できるように好きなテーブルをピン留め。
  • それぞれのクエリー結果に対しうる複数の可視化の追加。百聞は一見に如かずであり、DB SQLは鍵となる洞察を得るために様々な可視化を提供します。
  • Query Historyから以前のクエリーを参照。時には、数日前に実行したクエリーに立ち返る必要があるります。

Databricks SQLコラボレーションツールの説明動画 from Databricks on Vimeo.

ダッシュボードのサブスクライブ

ダッシュボードは洞察を永続化するための優れた方法です。ですので、毎日Databricksにログインするのかどうかにかかわらず、このような洞察を企業の誰でも容易にアクセスできるようにしました。

ダッシュボードのサブスクリプションを用いることで、お好きなタイミングでメールとPDFをデリバリーすることができます。Databricksワークスペースのユーザーに対して直接サブスクライブするか、企業内の非Databricksユーザーやメーリングリストにリーチするためにアラートを活用することができます。

Databricks SQLにおけるダッシュボードサブスクリプションの説明動画 from Databricks on Vimeo.

クエリー結果に基づくアラート

最も価値のあるデータとはアクションをとることができるデータです。最も突出したビジネスメトリクスを特定するためには、値が期待された範囲を超えて急激な増加あるいは減少したタイミングを検知することが重要です。異なるデータポイントにおいてキーとなる変化点を識別したのであれば、それらの閾値を超えた際に通知を行えるようにアラートを設定することができます。デフォルトではワークスペースの任意のユーザーつに通知することができますが、メーリングリスト、Slackのチャンネルへの投稿、PagerDutyのインシデントの作成が可能です。

Databricks SQLのアラートの説明動画 from Databricks on Vimeo.

次のステップ

Databricks SQLはすでにAtlassianPlumeのようなモダンビジネスにおいて分析のあり方を変化させており、皆様のフィードバックも心待ちにしています!そして、皆様の要望に応じてDatabricks SQLをより良いものにするために、皆様のアイデアの投稿も歓迎しています。

すでにDatabricksをお使いなのであれば、クイックスタートガイド(AWS|Azure)を活用して、すぐに利用を開始することができます。まだ、Databricksを利用されていないのであれば、是非こちらからフリートライアルをスタートしてみてください。

最後になりますが、10月6日にインストラクターによるフリーのDatabricks SQLワークショップがあります。興味のある方は是非ご参加ください!

Databricks 無料トライアル

Databricks 無料トライアル

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1