3
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

IBM Cloud Pak for Data as a Service ハンズオン資料(2.設定編)2021年8月作成/2023年3月更新

Last updated at Posted at 2021-08-01

2.設定編

Cloud Pak for Data as a Serviceハンズオンメニュー一覧

本記事では、上記の1.構築編によって準備されたSaaS環境にて、分析のために設定する手順を記載しています。

公式ドキュメント

  • IBM Cloud Pak for Data as a Service の公式ドキュメントはこちらをご参照下さい。

1.ガバナンス

1.1.カテゴリーの追加

  • 各種データ資産や成果物を分類しておくためのカテゴリーを作成しておきます。

  • カテゴリーについての公式ドキュメントはこちらを参考にして下さい。

  • IBM Cloud Pak for Data画面左上のハンバーガーメニューから、「ガバナンス」の「カテゴリー」をクリック。※グロッサリーを初期化するのに、少し時間がかかることがあります。しばらく時間が経過しても画面が変わらない場合には、ブラウザをリロードしてみてください。
    スクリーンショット 2021-07-29 19.23.24.png

  • 「カテゴリー」画面右上の「新規追加(Add category)」から「新しいカテゴリー(New category)」をクリック。
    スクリーンショット 2021-07-29 19.23.42.png

  • 任意で「カテゴリー名」や、「説明(オプション)」を入力し、「作成」ボタンをクリック
    スクリーンショット 2021-07-31 19.58.05.png

  • カテゴリーが作成されました。
    スクリーンショット 2021-07-31 20.01.57.png

  • カテゴリーをクリックして見てみます。

  • 内部でサブカテゴリーを作成したり、アクセス制御を行うことが可能です。
    スクリーンショット 2021-08-02 8.45.54.png

  • サブカテゴリー作成例
    スクリーンショット 2021-08-02 8.48.18.png
    スクリーンショット 2021-08-02 8.48.43.png

1.2.ビジネス用語

  • 各種データ資産などに紐付けて、ユーザがデータ等を検索しやすくするためにビジネス用語を事前に登録しておきます。

  • 組織内部でのコミュニケーションを円滑にすすめるためにも、共通の語彙・用語集は必要です。その整備にも使える機能となります。

  • なお、組織でのコミュニケーションと語彙・用語集の必要性については、こちらのブログも参考にしてみてください。

  • 無料のライト版では登録出来るビジネス用語は5つまでです。

  • ビジネス用語についての公式ドキュメントは、こちらを参考にして下さい。

1.2.1.ビジネス用語の追加

  • IBM Cloud Pak for Data画面左上のハンバーガーメニューから、「ガバナンス」の「ビジネス用語」をクリック。
    スクリーンショット 2021-07-29 19.35.28.png

  • 画面右上の「ビジネス用語の追加」から「新規ビジネス用語」をクリック。
    スクリーンショット 2021-07-31 20.04.55.png

  • 用語名、説明を入力します。

    • ここでは「オンライン顧客」と入力して下さい。
  • 1次カテゴリーの「変更」箇所を押して、先程作成したカテゴリを指定する。「ドラフトとして保存」ボタンで保存。
    スクリーンショット 2021-07-29 19.38.08.png

  • ドラフトとして作成されたビジネス用語。画面右上の「公開」をクリックして公開します。
    スクリーンショット 2021-07-29 19.38.56.png

  • コメントがあれば入力して、「公開」ボタンをクリック.
    スクリーンショット 2021-07-29 19.39.28.png

  • ビジネス用語が公開されました。
    スクリーンショット 2021-07-29 19.40.23.png

1.2.2.ビジネス用語の修正

  • ビジネス用語の内容を修正したい場合は、該当項目の箇所のペンマーク、あるいはプラスのマークをクリックします。

  • ここでは、画面右側の「スチュワード(Stewards)」の項目を追加します。

  • 「スチュワード」とは、ビジネス用語を整備する役割を指し、データや用語の詳細な意味を確認したい場合に、それを尋ねる連絡先、という意味になります。

  • 画面右上の「スチュワード(Stewards)」の右のプラスボタンをクリックします。
    スクリーンショット 2021-08-01 16.59.59.png

  • 意味を確認する先のIDを選択し、「追加」をクリックします。
    スクリーンショット 2021-08-01 17.02.13.png

  • スチュワードとして追加されました。再びドラフト状態になりましたので、改めて「公開」をクリックします。
    スクリーンショット 2021-08-01 17.05.04.png

  • 「公開」をクリックします。
    スクリーンショット 2021-08-01 17.06.13.png

1.3.分類

  • 扱う情報に関する機密度などの分類を管理することができます。

  • 今回は新たに作成せず、内容を確認するのみとします。

  • 分類に関する公式ドキュメントは、こちらをご参考下さい。

  • ハンバーガーメニューから「ガバナンス」の「分類」をクリックします。
    スクリーンショット 2021-08-02 8.50.48.png

-表示されているように、「Confidential」「Personal Information」などの情報が記載されています。
スクリーンショット 2021-08-02 8.51.57.png

  • 「Confidential」の内容。関連する一次、二次のカテゴリーや、分類の中でも親子関係を構築できることがわかります。
    スクリーンショット 2021-08-02 8.53.23.png

1.4.データ・クラス

  • 含まれるデータの型について定義するものです。

  • ライトプランでは、新しいデータクラスを作成できません。

  • データ・クラスに関する公式ドキュメントは、こちらをご参照下さい。

  • 画面比左上のハンバーガーメニューから、「ガバナンス」⇛「データ・クラス」をクリックします。
    スクリーンショット 2021-08-02 9.02.05.png

  • 事前定義されたデータ・クラスの一覧が表示されます。
    スクリーンショット 2021-08-02 9.02.53.png

  • 以下はEmailAddressの内容です。

  • データの型の突き合わせについてはJavaクラスを使用しています。
    スクリーンショット 2021-08-02 9.04.26.png

  • データの突き合わせ方式は、複数の方式から選択が可能です。「突き合わせ方式」の横のペンマークを選択すると、内容を確認・選択できます。
    スクリーンショット 2021-08-02 9.08.42.png

1.5.データ保護ルール

  • データ保護ルールについての公式ドキュメントについては、こちらを参考にして下さい。

1.5.1.データ保護ルール作成

  • データのマスキングのための条件等を定めたルールを作成します。

  • ハンバーガーメニューから「ガバナンス」⇛「ルール」をクリック。
    スクリーンショット 2021-07-30 23.24.40.png

「ルールの追加」⇛「新規ルール」をクリック。
スクリーンショット 2021-07-30 23.29.13.png

「データ保護ルール」をクリックして、「次へ(Next)」ボタンをクリック。
スクリーンショット 2021-07-30 23.30.16.png

  • 名前、説明を入力し、「基準」の箇所には合致条件を選択する。

    • 例えば「データクラス」「次のいずれかを含む」「email address」「identifier」「Person Name」
      スクリーンショット 2021-08-01 17.10.51.png
    • 例えば「タグ」「次のいずれかを含む」「個人情報」
      スクリーンショット 2021-08-01 17.11.20.png
    • 例えば「分類」「次のいずれかを含む」「Personal Information」「Personal Identifiable Information」
      スクリーンショット 2021-08-01 17.12.43.png
  • アクションの箇所には、条件に合致した場合に取るアクションを選択する。

    • 「データをマスク」「データ・クラス」「email address」「identifier」「Personal Name」
      スクリーンショット 2021-08-01 17.14.38.png
    • 「データへのアクセスを拒否」
      スクリーンショット 2021-08-01 17.13.56.png

1.5.2.データ保護ルール確認

  • ルールが作成されたことを確認。
    スクリーンショット 2021-07-31 0.14.42.png

2.コラボレータ招待

  • データのマスキングは、データの管理者からはマスキングされたようには見えません。
  • そのため、別な環境のユーザをコラボレータとして招待し、マスキングしたデータを観てもらうための下準備の作業です。
    • 準備として2段階あります。
      • A.IBM Cloudのユーザとして招待
      • B.Watson Knowledge Catalog のユーザとして招待。
    • 以下では、A.の作業を実施します。
    • ハンズオンの場においては、同時に受講される方、あるいは講師、あるいはご自分で既に持っているIBMid等を招待する対象としてみて下さい。
  • 以下の手順は、こちらの動画でも解説しています。参考にしてみて下さい。

2.1.IAM管理画面からコラボレータ招待。

2.1.1.アクセス・グループの作成

  • 画面右上のハンバーガーメニューから、「管理」⇛「アクセス(IAM)」をクリック。

  • (IBM Cloudの管理画面が新しいタブとして立ち上がります。)
    スクリーンショット 2021-07-31 0.44.44.png

  • 画面左側の「アクセス・グループ」をクリックし、画面右側の「作成」をクリック。
    スクリーンショット 2022-07-06 11.22.21.png

  • 名前と説明を入力。(ここではどちらも「WKC」とします。)
    スクリーンショット 2022-07-06 11.23.28.png

  • アクセス・グループ「WKC」が作成されました。次に画面真ん中の「ユーザーの追加」をクリックします。
    スクリーンショット 2022-07-06 11.24.56.png

  • 自分自身のIDが表示されていますので、選択して「グループに追加」をクリックして追加します。
    スクリーンショット 2022-07-06 11.26.47.png
    スクリーンショット 2022-07-06 11.27.32.png

2.1.2.アクセス・権限の作成と割り当て

  • 「Access」タブをクリックします。
    スクリーンショット 2022-07-06 11.28.10.png

  • 「アクセス権限の割り当て」をクリックします。
    スクリーンショット 2022-07-06 11.29.00.png

  • 「サービス」と書かれた下の検索窓に「Watson Knowledge Catalog」と入れようとすると、候補として挙がってくるので選択して「次へ」をクリックします。
    スクリーンショット 2022-07-06 11.30.41.png
    スクリーンショット 2022-07-06 11.31.45.png

  • 「すべてのリソース」が選択された状態で「次へ」をクリックします。
    スクリーンショット 2022-07-06 11.35.03.png

  • 「役割とアクション」の箇所で、今回は「ライター」と「エディター」を選択し、「レビュー」をクリックします。
    スクリーンショット 2022-07-06 11.36.30.png

  • 「追加」をクリックします。
    スクリーンショット 2022-07-06 11.37.19.png

  • 「割り当て」をクリックします。
    スクリーンショット 2022-07-06 11.37.57.png

  • アクセス権限「WKC」が作成されました。
    スクリーンショット 2022-07-06 11.38.38.png

2.1.3.アクセスグループへのユーザーの割り当て

  • 「ユーザー」タブをクリックして、画面右側の「ユーザーの招待」をクリック。
    スクリーンショット 2021-07-31 0.45.55.png

  • 「ユーザーの招待」画面
    スクリーンショット 2022-07-06 11.44.28.png

  • 招待したいユーザーのメールアドレス(他の参加者の方等)を入力。
    スクリーンショット 2021-07-31 0.48.57.png

  • 「どのようにアクセス権限を割り当てますか?」の箇所で、「アクセス・グループ」を選択。
    スクリーンショット 2022-07-06 11.45.15.png

  • 「グループ」で先程作成したグループ「WKC」を選択して、「追加」をクリックします。
    スクリーンショット 2022-07-06 11.46.32.png

  • 画面右側の「アクセス・サマリー」で、1ユーザー、1アクセスグループ、であることを確認し、「招待」をクリックします。これにより、対処メールアドレスに、招待リンクが付与されたメールが飛びます。
    スクリーンショット 2022-07-06 11.49.09.png

  • 招待した相手のステータスは、「処理中」になっています。
    スクリーンショット 2021-07-31 15.43.03.png

2.2.招待された側の画面での操作

  • 招待された方は、到着したメールから「Join Now」をクリック。
    スクリーンショット 2021-07-31 0.59.20.png

  • 「招待を受け入れる」をクリック。(招待された側の画面です。)

スクリーンショット 2021-12-10 19.53.38.png

スクリーンショット 2021-12-10 19.50.48.png

  • ここまでが、招待された側の画面でした。

2.3.招待したユーザの状況を確認

  • 招待した側のIBM Cloudの管理画面を見ると、招待されたアカウントの状況が「処理中」から「アクティブ」に代わっていることがわかります。
    (招待した側の画面です。)
    スクリーンショット 2021-07-31 15.45.20.png

3.データカタログ

  • 各種成果物を登録出来るカタログを作成します。
  • なお、ライト版で作成できるカタログは一つだけです。
  • データカタログに関する公式ドキュメントは、こちらをご参考下さい。
  • こちらの動画で、以下手順を解説していますので、参考にしてみてください。

3.1.カタログ作成

  • IBM Cloud Pak for Data画面左上のハンバーガーメニューから「カタログ」から「すべてのカタログを表示」をクリック。

  • 「カタログを作成」をクリック。
    スクリーンショット 2021-07-31 21.24.12.png

  • 名前と説明を入力し、ストレージを設定します。

  • IBM Cloud Object Storageがない場合には画面下の「ここ」をクリックして作成してください。
    スクリーンショット 2023-02-22 18.02.51.png

  • この記事では「データ保護およびデータ・ロケーション・ルールの適用」にチェックを入れています。

  • チェックを入れると、以下ポップアップが挙がってくるので、「OK」を押します。
    スクリーンショット 2023-02-22 18.12.18.png

  • 以下のようにチェックが入ることを確認します。(カタログ作成後、このチェックは変更できなくなるので注意してください。)
    スクリーンショット 2023-02-22 18.15.09.png

3.1.1.ポリシーが適用されていることを確認。

「設定」タブを確認し、ガバナンスポリシーが適用されていることを確認。
スクリーンショット 2021-07-31 0.01.03.png

3.2.各種データ資産追加

3.2.1. ローカル・ファイルの追加

  • 画面右上の「カタログに追加」から「ローカル・ファイル」をクリック。
    スクリーンショット 2021-07-31 0.15.27.png

  • 画面左上箇所に手持ちのcsvファイルをドラッグアンドドロップする。

  • なおこのファイルは手順の2.デモ用データを準備するにて作成したもの。

  • 内容としては個人情報のようですが、実はこのサイトで生成した疑似個人情報なので、内容を公開しても問題はありません。

  • 説明としては2020年度のオンライン顧客情報(ダミー)とし、ビジネス用語として「オンライン顧客」、タグとして「個人情報」「2020」を入力。

  • 分類としては「Personal Information」と入力。

  • 「ロケーション」「主権」に関しては今回(2023年2月末時点で)は使用しませんので、そのままにしておいてください。

  • 「追加」ボタンをクリック。
    スクリーンショット 2023-02-22 21.07.02.png

  • ファイルが追加されたことを確認。
    スクリーンショット 2021-07-31 0.22.21.png

3.2.1.1. プロファイル画面での、データ・クラスの見直し

  • こちらの動画で、プロファイルの解説を行っていますので、参考にしてみてください。

  • プロファイルが完成している場合、データクラスを見直してみます。データ資産の「プロファイル」タブをクリックします。

  • なお完成していない場合は、少し待つために別な作業に入って下さい。
    スクリーンショット 2021-07-31 20.34.13.png

  • 例えば人名の箇所が未分類だったりした場合は、別なデータクラス(Personal Name)等に修正します。

  • 以下の例では、データ・クラスが「Identifier」のものを「Person Name」に編集します。
    「Identifier」横の下向き矢印をクリックして「すべて表示」をクリック。
    スクリーンショット 2021-07-31 16.04.43.png

  • 浮き出たウインドウの上部検索から文言を検索し、適切なデータクラスを選択して、「追加」をクリック。
    スクリーンショット 2021-07-31 16.07.55.png

  • データ・クラスが更新されたことを確認。
    スクリーンショット 2021-07-31 16.08.24.png

3.2.2.「接続」定義の追加

3.2.2.1.前提事項

3.2.2.2.接続の登録作業

  • カタログ画面右上の「カタログに追加」から「接続」をクリック。
    スクリーンショット 2021-07-29 18.26.32.png

  • 「db2」を選んで、「選択」ボタンをクリック。
    スクリーンショット 2021-07-29 19.00.23.png

  • 接続に必要な情報を入力。
    スクリーンショット 2021-07-31 20.47.28.png
    スクリーンショット 2021-07-31 20.45.47.png
    スクリーンショット 2021-07-31 20.46.22.png

  • 画面右上の「接続のテスト」ボタンをクリックして、設定により正しく接続されたことを確認し、「作成」をクリック。
    スクリーンショット 2021-07-29 19.04.58.png

  • 接続が登録されました。
    スクリーンショット 2021-07-29 19.05.35.png

3.2.3.「接続された資産」の追加

  • 接続を登録した後のデータカタログにて、画面右上の「カタログに追加」から「接続された資産」をクリック。
    スクリーンショット 2021-07-29 19.12.16.png

  • 「ソースの選択」ボタンをクリック
    スクリーンショット 2021-07-29 19.13.05.png

  • 先程登録したデータソースをクリックして、スキーマ、テーブルを選んで、選択をクリック。
    スクリーンショット 2021-07-29 19.13.47.png

  • 名前、説明、ビジネス用語、を入力。
    スクリーンショット 2021-07-29 19.44.35.png

  • タグ、分類を入力して追加をクリック。プライバシーは今回はパブリックのままで良いです。
    スクリーンショット 2021-07-29 19.45.41.png

  • データ資産として登録されました。
    スクリーンショット 2021-07-29 19.46.36.png

3.2.4.メタデータインポートによるデータ資産のカタログへの追加

3.3.カタログの「アクセス制御」画面からコラボレータ招待。

  • データのマスキングは、データの管理者からはマスキングされたようには見えません。

  • そのため、別な環境のユーザをコラボレータとして招待し、マスキングしたデータを観てもらうための下準備の作業です。

    • 準備として2段階あります。
      • A.IBM Cloudのユーザとして招待
      • B.Watson Knowledge Catalog のユーザとして招待。
    • 以下では、B.の作業を実施します。
    • ハンズオンの場においては、同時に受講される方、あるいは講師、あるいはご自分で既に持っているIBMid等を招待する対象としてみて下さい。
  • カタログへのコラボレータの追加についての公式ドキュメントは、こちらを参考にして下さい。

  • 招待する側は、カタログの「アクセス制御」タブをクリックし、画面右側の「コラボレータの追加」をクリック。
    スクリーンショット 2021-07-31 1.02.18.png

  • 権限を、例えばビューアとして、招待したユーザのメールアドレスを選択して、「追加」をクリック。
    スクリーンショット 2021-07-31 1.04.41.png

「アクセス制御」画面に、ビューアとして新たにユーザが追加されていることを確認。
スクリーンショット 2021-07-31 1.06.56.png

3.4.招待されたユーザ側で、マスキングを確認。

  • (ここからは招待されたユーザー側の画面になります。)

招待されたユーザは、「すべてのカタログ」画面で新たにカタログが追加されていることを確認。(ビューアーと表示されているもの)
スクリーンショット 2021-07-31 1.12.05.png

当該カタログを確認し、データ資産を確認する。
スクリーンショット 2021-07-31 1.13.23.png

  • データ資産の「プロファイル」タブをクリックすると、個人として特定されそうな情報がマスクされていることが確認できます。
    スクリーンショット 2021-07-31 21.35.16.png

  • データ資産の「資産」タブを確認する。マスキングされていることがわかります。

  • (以下の例では、「電話番号」が無意味な文字に変換されています。)

  • ある程度時間が経つとマスクされたデータが表示されます。

  • ここでは、以下のものがマスキングされています。

    • データ・クラスが「Person Name」である「氏名」「氏名(ローマ字)」
    • データ・クラスが「Identifier」である「電話番号」
      スクリーンショット 2021-07-31 21.38.52.png

4.プロジェクト作成

  • プロジェクトとは、テーマやチーム毎に作成される、分析を行うためのある種のサンドボックス的な位置付けの箱のようなものです。ここで様々なデータや分析ツールを一元管理できます。

  • プロジェクトに関する公式ドキュメントについてはこちらを参考にして下さい。

  • ハンバーガーメニューから、「すべてのプロジェクトを表示」をクリック。
    スクリーンショット 2021-07-29 21.07.45.png

  • 「新規プロジェクト」をクリック。
    スクリーンショット 2021-07-29 21.08.17.png

  • 「空のプロジェクトを作成」をクリック。
    スクリーンショット 2021-07-29 21.08.33.png

  • プロジェクト名や説明を入力、ストレージが設定されていることを確認して、「作成」をクリック。
    スクリーンショット 2021-07-29 21.26.26.png

5. メタデータインポート

6. メタデータエンリッチメント

次のハンズオン

3
3
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?