0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Microsoft Purview Data Governance で Snowflake のオブジェクトやリネージ情報などのメタデータを抽出する

Last updated at Posted at 2024-09-17

はじめに

Purview Data Governance の Data Map は様々なテクニカルメタデータを収集します。
その対象に Snowflake のメタデータがあるので実際にやってみます。

参考

準備

試用版の snowflake にサインアップして、以下のようにサンプルクエリに少し手を加えたスクリプトを実行します。

sql
/*--
Tasty Bytes is a fictitious, global food truck network, that is on a mission to serve unique food options with high
quality items in a safe, convenient and cost effective way. In order to drive forward on their mission, Tasty Bytes
is beginning to leverage the Snowflake Data Cloud.

Within this Worksheet, we will walk through the end to end process required to load a CSV file containing Menu specific data
that is currently hosted in Blob Storage.
--*/

-------------------------------------------------------------------------------------------
    -- Step 1: To start, let's set the Role and Warehouse context
        -- USE ROLE: https://docs.snowflake.com/en/sql-reference/sql/use-role
        -- USE WAREHOUSE: https://docs.snowflake.com/en/sql-reference/sql/use-warehouse
-------------------------------------------------------------------------------------------

/*-- 
    - To run a single query, place your cursor in the query editor and select the Run button (⌘-Return).
    - To run the entire worksheet, select 'Run All' from the dropdown next to the Run button (⌘-Shift-Return).
--*/

---> set the Role
USE ROLE accountadmin;

---> set the Warehouse
USE WAREHOUSE compute_wh;

-------------------------------------------------------------------------------------------
    -- Step 2: With context in place, let's now create a Database, Schema, and Table
        -- CREATE DATABASE: https://docs.snowflake.com/en/sql-reference/sql/create-database
        -- CREATE SCHEMA: https://docs.snowflake.com/en/sql-reference/sql/create-schema
        -- CREATE TABLE: https://docs.snowflake.com/en/sql-reference/sql/create-table
-------------------------------------------------------------------------------------------

---> create the Tasty Bytes Database
CREATE OR REPLACE DATABASE tasty_bytes_sample_data;

---> create the Raw POS (Point-of-Sale) Schema
CREATE OR REPLACE SCHEMA tasty_bytes_sample_data.raw_pos;

---> create the Raw Menu Table
CREATE OR REPLACE TABLE tasty_bytes_sample_data.raw_pos.menu
(
    menu_id NUMBER(19,0),
    menu_type_id NUMBER(38,0),
    menu_type VARCHAR(16777216),
    truck_brand_name VARCHAR(16777216),
    menu_item_id NUMBER(38,0),
    menu_item_name VARCHAR(16777216),
    item_category VARCHAR(16777216),
    item_subcategory VARCHAR(16777216),
    cost_of_goods_usd NUMBER(38,4),
    sale_price_usd NUMBER(38,4),
    menu_item_health_metrics_obj VARIANT
);

---> confirm the empty Menu table exists
SELECT * FROM tasty_bytes_sample_data.raw_pos.menu;

---> create stream for cdc 
CREATE OR REPLACE STREAM stream_menu on table tasty_bytes_sample_data.raw_pos.menu

---> create the Stage referencing the Blob location and CSV File Format
CREATE OR REPLACE STAGE tasty_bytes_sample_data.public.blob_stage
url = 's3://sfquickstarts/tastybytes/'
file_format = (type = csv);



---> create view

CREATE OR REPLACE VIEW v_FreezinePoint_menu AS 
    SELECT *,(sale_price_usd - cost_of_goods_usd) AS profit_usd 
    FROM tasty_bytes_sample_data.raw_pos.menu 
    WHERE truck_brand_name = 'Freezing Point'

---> create proc

CREATE OR REPLACE PROCEDURE GET_TOP_SALES()
RETURNS TABLE (MENU_ITEM_NAME VARCHAR, PROFIT_USD NUMBER)
LANGUAGE SQL
EXECUTE AS CALLER
AS
DECLARE
  RES RESULTSET DEFAULT (
  SELECT 
   MENU_ITEM_NAME,
   (SALE_PRICE_USD - COST_OF_GOODS_USD) AS PROFIT_USD
    FROM TASTY_BYTES_SAMPLE_DATA.RAW_POS.MENU
    ORDER BY PROFIT_USD DESC LIMIT 10
    );
BEGIN
  RETURN TABLE(RES);
END;


CREATE OR REPLACE PROCEDURE COPY_INTO_MENU()
RETURNS VARCHAR NOT NULL
LANGUAGE SQL
AS
BEGIN
    COPY INTO TASTY_BYTES_SAMPLE_DATA.RAW_POS.MENU
    FROM @TASTY_BYTES_SAMPLE_DATA.PUBLIC.BLOB_STAGE/raw_pos/menu/;

    RETURN 'Rows inserted: ' || SQLROWCOUNT;
    
END;


---> run

CALL COPY_INTO_MENU();
CALL GET_TOP_SALES();

---> check changes 

SELECT * FROM stream_menu

以下のようにいくつかのオブジェクトが作成できました。

image.png

次に、スキャンに必要なアクセス許可 を参考に Purview からの参照用ユーザーを作成します。

stream に対しての権限が付与されてなかったので追加

sql

GRANT SELECT ON ALL  STREAMS IN DATABASE TASTY_BYTES_SAMPLE_DATA TO role purview_reader;
GRANT SELECT ON FUTURE STREAMS IN DATABASE TASTY_BYTES_SAMPLE_DATA TO role purview_reader;

Purview Data Map によるメタデータの抽出

ソース登録~スキャンの作成・実行

まずはスキャン対象の Snowflake を登録します。

image.png

image.png

image.png

登録後、スキャンを作成します。

image.png

作成時に資格情報がなければ作成 します。現在のところ基本認証のみが対応しています。

image.png

資格情報では、以下のように パスワードを記録した Key Vault シークレット名を指定します。

image.png

secret を作成します。
なお、事前に Purview にはKey Vault へのシークレット利用権限(Secret User 等のロール)が必要です

image.png

残りの情報を入力したらこの接続をテストします。

image.png

ストアドプロシージャの系列取得には追加の設定があります。

image.png

image.png
https://learn.microsoft.com/ja-jp/purview/register-scan-snowflake#create-and-run-scan

ここまでの設定ができていれば、テスト接続が成功します。

データベース名などは大文字小文字の違いにより動作しないことがあるのでうまくいかない場合はそのあたりを疑ってみましょう

image.png

データの分類規則などが定義されたスキャンルールセットを選択し、一度だけのスキャン実行を構成したら保存・実行します。

image.png

image.png

image.png

しばらく待つと、スキャンと取り込みが成功しました。

テクニカルメタデータの確認

スキャン結果を確認していきます。

10件が取り込まれています。

image.png

まずは基本となるテーブル。分類され、住所を含むテーブルと認識されたようです。

image.png

列項目

image.png

リネージでは、stored procedure , view および stream と接続され、PROFIT_USD が SALE_PRICE_USD と関連をもつことがわかります。

image.png

ストアドのリネージはオブジェクトの大文字小文字を区別しているようでした。
小文字で テーブル名を書いてたりするとリネージに記録されず、少し苦戦しました。

最後に、COPY 句のストアドの場合にリネージが取れてませんでした。対応しているステートメントには制限があるのかも

COPY_INTO_MENU

image.png

image.png

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?