2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

こちらの機能の存在を知っていましたが、きちんとマニュアル読んでいませんでした。

予測的最適化(Predictive Optimization)により、Unity Catalog マネージドテーブルのメンテナンスオペレーションを手動で管理する必要がなくなります。

OPTIMIZEVACUUMANALYZEオペレーションのメリットがあるテーブルを特定し、自動でオペレーションを特定する機能です。

注意点として、自動でオペレーションが実行するので課金(DBU: Databricks Units)が発生します。当然、これらは監視すべき事項となります。その助けとなるのが予測的最適化システムテーブルとなります。クエリのサンプルがあるので、実行してみます。

過去30日間に予測的最適化によって使用された推定DBU

推定DBUとなっているのは、こちらに記載があるように、複数オペレーションの比率が概算であることによります。消費DBU自体は正確なものとなります。

SELECT SUM(usage_quantity)
FROM system.storage.predictive_optimization_operations_history
WHERE
     usage_unit = "ESTIMATED_DBU"
     AND  timestampdiff(day, start_time, Now()) < 30

Screenshot 2025-01-22 at 9.17.58.png

過去30日間で予測的最適化による費用が最も多いテーブル

SELECT
     metastore_name,
     catalog_name,
     schema_name,
     table_name,
     SUM(usage_quantity) as totalDbus
FROM system.storage.predictive_optimization_operations_history
WHERE
    usage_unit = "ESTIMATED_DBU"
    AND timestampdiff(day, start_time, Now()) < 30
GROUP BY ALL
ORDER BY totalDbus DESC

予測的最適化によるコストがテーブルごとに表示されます。

Screenshot 2025-01-22 at 9.19.22.png

予測的最適化のオペレーションが最も多いテーブル

SELECT
     metastore_name,
     catalog_name,
     schema_name,
     table_name,
     operation_type,
     COUNT(DISTINCT operation_id) as operations
FROM system.storage.predictive_optimization_operations_history
GROUP BY ALL
ORDER BY operations DESC

テーブルごと、オペレーションごとの回数が表示されます。

Screenshot 2025-01-22 at 9.20.59.png

予測的最適化オペレーションの成功率

WITH operation_counts AS (
     SELECT
           COUNT(DISTINCT (CASE WHEN operation_status = "SUCCESSFUL" THEN operation_id END)) as successes,
           COUNT(DISTINCT operation_id) as total_operations
    FROM system.storage.predictive_optimization_operations_history
 )
SELECT round(successes / total_operations * 100, 1) || "%" as success_rate
FROM operation_counts

Screenshot 2025-01-22 at 9.22.15.png

ダッシュボードの作成

これらのデータをまとめることで、予測的最適化オペレーションの概要を把握することができます。

Screenshot 2025-01-22 at 9.23.05.png

ご活用ください

はじめてのDatabricks

はじめてのDatabricks

Databricks無料トライアル

Databricks無料トライアル

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?