4
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Databricks System Table を有効化して監査ログや課金データを取得しよう!

Last updated at Posted at 2023-07-16

Unity Catalog の機能である System TableがPublic Previewとなり、audit log情報と billing情報が確認出来るようになったという事で早速セットアップして確認してみたいと思います。

System Tableとは?

System Tables は、Databricks がホストする運用データおよび使用データの分析ストアです。

System Tables は、Databricks Platform コンポーネントのパフォーマンス、使用状況、および動作を監視、分析するために使用できます。これらのテーブルをクエリすることで、ユーザはジョブ、ノートブック、ユーザ、クラスタ、MLエンドポイント、SQLウェアハウスがどのように機能し、経時的に変化しているかについての洞察を得ることができます。この履歴データは、パフォーマンスの最適化、問題のトラブルシューティング、使用パターンの追跡、およびデータ駆動型の意思決定に使用できます。

image.png

System Tableを有効にする

System Tables は、少なくとも 1 つのワークスペースで Unity Catalog を有効化している顧客が利用できます。提供されるデータは、ワークスペースのUnity Catalogのステータスに関係なく、Databricksアカウント内のすべてのワークスペースから収集されますので、1箇所のワークスペース上で有効にするだけで十分です。

システムテーブルを有効にするには、APIコールを使用するか、Databricksノートブックで直接行います。詳細はお使いのクラウドのドキュメントを参照してください。 (AWS | Azure)

Databricks ノートブックを利用して有効化する。

こちらのノートブックをワークスペース上にインポートして、metastore管理権限があるユーザーが実行してください。ノートブックで必要なTokenやMetastoreID などを取得して、API経由で設定を有効化しております。

image.png

System Tableを確認する

データエクスプローラを開いて、systemカタログを見ると以下のように、access / billing / lineage などのスキーマが確認できます。これで必要な情報をこのテーブルから取得することが可能です。

image.png

どこにデータは保存されているの?

そもそもこのログデータはどこに保存されるのでしょう?それはSystem Tableの詳細タブを確認するとわかります。

image.png

わかりますでしょうか? Unity CatalogのDeltaSharingを使って、共有されてたテーブルを見ているのです。つまりデータはDatabricks上で管理されており、Read Onlyでアクセスできるようになっております。そのためストレージコストはかかりませんし、ユーザーによる改ざんも出来ません。DeltaSharing便利ですね。

制限事項

現時点では、現時点では、こちらのマニュアルを確認すると以下のような制約があるようです。

  • リアルタイムのモニタリングには対応していない。データは1日中更新されます。最近のイベントのログが表示されない場合は、後で確認してください。
  • システムスキーマsystem.operational_dataとsystem.lineageに空のテーブルが含まれる可能性があります。
  • システムスキーマsystem.accessとsystem.billingはパブリックプレビューで、すべての顧客が利用できます。Databricks では、パブリック・プレビューのシステム・スキーマのみを使用することを推奨しています。

可視化して分析してみよう。

テーブルの詳細やサンプルはこちらをご覧ください。audit| billing

日々の使用量をチェック

SELECT usage_date as `Date`, sum(usage_quantity) as `DBUs Consumed`
  FROM system.billing.usage
GROUP BY usage_date
ORDER BY usage_date ASC

Next

次にこれらのデータを使ってもう少し詳細なデータ分析をしてみたいと思います。
少し長くなりますので、別の記事で紹介したいと思います。

4
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?