0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

Cloud Pak for Data4.0のハンズオン資料:データアセットの理解とソーシャル化(第4回)

Posted at

データアセットの理解とソーシャル化(第4回)

記事の内容

WKCの主要な機能を記載いたします。
• データユーザの作成(第1回)
• カタログ・プロジェクトを作成する(第2回)
• データアセットの探索、カタログ化する(第3回)
• データアセットの理解とソーシャル化(第4回)(当記事)
• データのショッピング(必要なデータの選択)(第5回)
• アナリティックスやAIで必要なデータの準備(第6回)
• 機微(センシティブ)なデータの保護(第7回)

本記事は、上記のデータユーザの作成(第3回) の続きです。

本記事では、構造化データ資産のプロファイルセクションにアクセスして、提供されているプロファイルおよび分類の機能を調べます。
また、レビュー・セクションにアクセスして、他のユーザーがランキングおよびコメントを確認することで、資産の利用価値を確認することができます。自分で評価することもできます。

##公式ドキュメント
IBM Cloud Pak for Dataの公式ドキュメントはこちらをご参照ください。

本編

データ資産のディスカバーとカタログ化

image.png

  1. 「最新の追加セクション」をクリックします。

  2. 自動車保険顧客をクリックして、その資産のプロパティを表示します。
    image.png
    資産の概要セクションが表示されます。このセクションでは、資産に関するメタデータおよびデータの1000行のサンプルが表示されます。これには、データ資産の場合は列レベルの分類が含まれます。その名前と説明を変更し、タグを追加し、資産または列レベルでビジネス用語および種別を割り当てることができます。

  3. プロファイルセクションをクリックします。
    プロファイルが自動的に表示されます。もし、存在しない場合は、プロファイルを作成または更新してください。
    image.png
    リレーショナル・データや構造化データを含むデータ資産のプロファイルは、データの最初の5000行に基づいて、データセット内の各列に関する情報を表示します。プロファイルには、推論された属性分類子の頻度と各列の統計が表示されます。
    属性分類子は、列内のデータの内容(例:市区町村、口座番号、クレジットカード番号など)を定義します。データを匿名化するためには、属性分類子が必要となります。属性分類子は、資産の概要ページとプロファイルページの列ごとに表示されます。

  4. 「CREDITCARD_EXP」列が見えるまで右にスクロールします。
    現在の用語集には、機密情報を保護するためのデータ保護ルールが作成されていません。データ資産をカタログに追加しても、所有者はデータの内容が見えなくなることはありません。別のユーザーがログインしてデータを表示しようとすると、データ保護ルールが有効になった場合は、データが保護されるようになります。
    データクラス(分類子)に基づくデータ保護ルールを適用するためには、データクラス(分類子)の割当てを正しく行う必要があります。クレジットカードの「クレジットカードの有効期限」と「セキュリティ番号」を保護するために、CREDITCARD_EXP列およびCREDITCARD_CVV列に適切なデータクラス(分類子)を設定しておく必要があります。
    image.png

  5. 「CREDITCARD_EXP」列のDateの横の矢印を選択します。

  6. 「すべて表示」を選択します。
    image.png

  7. 検索エリアで、「Credit Card」と入力します。

  8. 「Credit Card Expiration Date」 を選択します。

  9. 「追加」 を押します。
    image.png

  10. 「CREDITCARD_CVV」 列の 「Not classified」 の矢印を選択し、「すべて表示」をクリックします。
    image.png

  11. 検索エリアに 「credit card」 と入力します。

  12. 「Credit Card Validation Number」 を選択します。

  13. 「追加」を押します。
    image.png

  14. レビューセクションを選択し、評価レートとレビューを確認します。
    image.png

  15. 以下を入力します。
    「この自動車保険顧客データは、信頼できる自動車保険DBから取得された品質が担保されたデータです。ただし、このデータの完全な価値を取得するには、その値を自動車保険の保険証券と請求データと組み合わせる必要があります。」

  16. 4つの★を入力します。

  17. 「実行依頼」をクリックします。
    image.png
    注 – 全体的なレーティングが4.0になりました。

  18. カタログ内のアセット一覧に戻ります。「自動車保険」をクリックします。
    image.png

  19. 「高評価セクション」をクリックして、自動車保険顧客が最も高い評価レートを獲得していることを確認します。

  20. データ資産一覧から、「2017 J.D. Power U.S. 自動車保険請求 満足度サーベイ」を選択します。
    image.png

  21. 「資産」を選択します。
    image.png
    資産セクションにはPDFが表示され、その内容を確認することができます。読み込めない時は、ブラウザを更新してください。

  22. レビューセクションをクリックします。
    image.png

  23. 以下を入力します。
    「自動車請求の満足度に関する調査で非常に興味深いですが、自動車保険の請求分析プロジェクトには役立ちません。」

  24. 3つ星を選択します。

  25. 「実行依頼」をクリックします。
    image.png
    注 – 全体的なレーティングが3つ星になっていることがわかります。

  26. 「自動車保険」を選択して、カタログ内の資産一覧に戻ります。
    image.png

  27. 高評価セクションを選択します。
    2017 J.D. Power U.S. 自動車保険請求満足度サーベイデータ資産が2番目に高評価であることが確認できます。

  28. 「省略」を押すと、このエリアが省略されます。
    image.png

次のハンズオン

次は、データのショッピング(必要なデータの選択)(第5回)です。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?