今回は資産のスキャン時に利用されるスキャンルールセットについて見ていきます。
スキャンルールセット
スキャンルールセットは、資産をスキャンする際に利用されるデータ分類のルールや、スキャン対象の拡張子など、複数のルールをまとめる役割があります。
サポートされているソースに対して既定のルールが存在し、カスタムする事可能です。
既存のルールを確認
まずは既存のシステムルールを確認します。
1. Azure Purview Studio より「Management Center」を選択し、「Scan rule sets」をクリック。既存のルール一覧が表示される。
2. AdlsGen2 ルールの「Version 1」をクリックし、現在の設定を確認。検索対象ファイルの拡張子や分類のルールが確認できる。
3.「Cancel」で画面を閉じ、「AzureCosmosDB」のルールも確認。こちらはファイルの拡張子設定はなく、分類のルールのみが確認できる。
カスタムルールの作成
次にカスタムルールを作成してみます。
2.「Source Type」で任意のデータソースを選択。ここでは「Azure SQL Database」を選択。任意の名前を指定し、「Continue」をクリック。
3. ルールの一覧より分類したいルールのみチェックを入れる。「Create」をクリックして作成。
作成したルールを使ってスキャンを実行
1.「Sources」より「Azure SQL Database」のスキャンをクリック。
3. スキャン対象を選択して、「Continue」をクリック。
4. ルールの選択画面で、先ほど作成したルールが表示されることを確認。
5. 作成したルールを選択。ウィザードを進めてスキャンを実行。スキャン一覧からもカスタムルールが使われている事が確認できる。
カスタムファイルタイプの設定
Blob や Azure Data Lake のスキャンルールセットなどではファイルの拡張子を選択できますが、独自のファイル拡張子をサポートすることもできます。
1.「Scan rule sets」より「New」をクリック。
3. ファイルの種類選択画面で「New file type」をクリック。
4. カスタム拡張子の名前と、そのファイルがどの形式かを指定。システムファイルタイプに適切なものがない場合、カスタムの区切り文字を設定することも可能。
5. 設定を続けて完了する。
既定のルールは環境によっては多すぎて、スキャンのパフォーマンスを下げる要因となるため、必要に応じて最適化を行ってください。
次回は分類を見ていきます。