データアセットの理解とソーシャル化(第4回)
記事の内容
WKCの主要な機能を記載いたします。
• データユーザの作成(第1回)
• カタログ・プロジェクトを作成する(第2回)
• データアセットの探索、カタログ化する(第3回)
• データアセットの理解とソーシャル化(第4回)(当記事)
• データのショッピング(必要なデータの選択)(第5回)
• アナリティックスやAIで必要なデータの準備(第6回)
• 機微(センシティブ)なデータの保護(第7回)
本記事は、上記のデータユーザの作成(第3回) の続きです。
本記事では、構造化データ資産のプロファイルセクションにアクセスして、提供されているプロファイルおよび分類の機能を調べます。
また、レビュー・セクションにアクセスして、他のユーザーがランキングおよびコメントを確認することで、資産の利用価値を確認することができます。自分で評価することもできます。
##公式ドキュメント
IBM Cloud Pak for Dataの公式ドキュメントはこちらをご参照ください。
本編
データ資産のディスカバーとカタログ化
-
「最新の追加セクション」をクリックします。
-
自動車保険顧客をクリックして、その資産のプロパティを表示します。
資産の概要セクションが表示されます。このセクションでは、資産に関するメタデータおよびデータの1000行のサンプルが表示されます。これには、データ資産の場合は列レベルの分類が含まれます。その名前と説明を変更し、タグを追加し、資産または列レベルでビジネス用語および種別を割り当てることができます。 -
プロファイルセクションをクリックします。
プロファイルが自動的に表示されます。もし、存在しない場合は、プロファイルを作成または更新してください。
リレーショナル・データや構造化データを含むデータ資産のプロファイルは、データの最初の5000行に基づいて、データセット内の各列に関する情報を表示します。プロファイルには、推論された属性分類子の頻度と各列の統計が表示されます。
属性分類子は、列内のデータの内容(例:市区町村、口座番号、クレジットカード番号など)を定義します。データを匿名化するためには、属性分類子が必要となります。属性分類子は、資産の概要ページとプロファイルページの列ごとに表示されます。 -
「CREDITCARD_EXP」列が見えるまで右にスクロールします。
現在の用語集には、機密情報を保護するためのデータ保護ルールが作成されていません。データ資産をカタログに追加しても、所有者はデータの内容が見えなくなることはありません。別のユーザーがログインしてデータを表示しようとすると、データ保護ルールが有効になった場合は、データが保護されるようになります。
データクラス(分類子)に基づくデータ保護ルールを適用するためには、データクラス(分類子)の割当てを正しく行う必要があります。クレジットカードの「クレジットカードの有効期限」と「セキュリティ番号」を保護するために、CREDITCARD_EXP列およびCREDITCARD_CVV列に適切なデータクラス(分類子)を設定しておく必要があります。
-
「CREDITCARD_EXP」列のDateの横の矢印を選択します。
-
検索エリアで、「Credit Card」と入力します。
-
「Credit Card Expiration Date」 を選択します。
-
「CREDITCARD_CVV」 列の 「Not classified」 の矢印を選択し、「すべて表示」をクリックします。
-
検索エリアに 「credit card」 と入力します。
-
「Credit Card Validation Number」 を選択します。
-
以下を入力します。
「この自動車保険顧客データは、信頼できる自動車保険DBから取得された品質が担保されたデータです。ただし、このデータの完全な価値を取得するには、その値を自動車保険の保険証券と請求データと組み合わせる必要があります。」 -
4つの★を入力します。
-
「高評価セクション」をクリックして、自動車保険顧客が最も高い評価レートを獲得していることを確認します。
-
「資産」を選択します。
資産セクションにはPDFが表示され、その内容を確認することができます。読み込めない時は、ブラウザを更新してください。 -
以下を入力します。
「自動車請求の満足度に関する調査で非常に興味深いですが、自動車保険の請求分析プロジェクトには役立ちません。」 -
3つ星を選択します。
-
高評価セクションを選択します。
2017 J.D. Power U.S. 自動車保険請求満足度サーベイデータ資産が2番目に高評価であることが確認できます。
次のハンズオン
次は、データのショッピング(必要なデータの選択)(第5回)です。