この記事は、先日発表された Azure Purview について、概要とセットアップを紹介します。
Azure Purview とは
仕事でデータにアクセスする際、以外と多くの課題があります。例えば:
- どこにデータソースがあるか、そもそも分からない
- データソースは見つけたがアクセス権がなく、また依頼先が分からない
- それっぽいファイル/データベース名は見つけたが、中身は開くまで分からない
- データカタログが複数あり、検索が面倒
またデータの管理者としても、多くの課題があります。例えば:
- 組織内のデータソースを把握しきれない
- データソースに個人情報が含まれるかは、開かないと分からない
- 管理者が分からないデータソースがある
- データの出所や、利用先が分からない
Azure Purview はこれらの課題を解決するマネージドソリューションであり、データソースをカタログ化するサービスです。多くのデータソースに簡単に接続でき、メタデータを自動抽出することでカタログ化します。例えば:
- データに対して分類を付与
- スキーマや場所の情報を取得
- 所有者や専門的な知識をもつユーザーの紐づけ
- 他データソースとの関連の自動作成
分類やタグ付けのルールなど細かくカスタマイズできるため、組織のニーズに合わせた柔軟な対応ができます。より詳細は 公式: Azure Purview とは を参照してください。
個人的には説明分を読んでもあまりピンとこなかった派のため、これから実際に試していきましょう。尚、2021 年 2 月 28 日まではプレビューが無償で利用できるため、学習し放題です。※データソース側のコストはかかります。
セットアップ
Azure Purview 自体のセットアップは通常の Azure リソースと同じ要領で行います。
1. Azure Portal より「リソースの作成」をクリックし、「Azure Purview」を検索。
3. リソースグループや名前を指定して作成。場所はまだ日本はありませんので、適当に選択してください。構成などは既定のままでいいと思います。作成完了後、リソースへ移動。
4.「Open Purview Studio」をクリックし、スタジオを起動。
サンプルデータの登録
Azure Purview を試すには、まずはデータが必要ですが、公式ページでサンプルデータの提供と登録方法がステップバイステップで提供されています。
次回は チュートリアルのスターターキット を見ながら実際にデータを登録してみます。
参考
公式ドキュメント: Azure Purview
ビデオ: Azure Synapse 提供開始 / Azure Purview プレビュー発表「Shape Your Future with Azure Data and Analytics」(日本語字幕付き)
公式サイト: Azure Purview
チュートリアルのスターターキット