分類とは
分類とは、簡単に言うと、カタログに登録するデータ資産にラベリングするための機能です。一見、タグにもよく似ていますが、タグは自由な意味を付与して、利用するものに対して、分類は、主に、機密レベル(Restricted,Confidentialなど)、ビジネス重要度(Critical,Important)や個人情報の機微性などを表現するために用いられます。例えば、以下のような分類です。
機密レベル
- 極秘
- 部外秘
- 社外秘
ビジネス重要度
- 最重要
- 重要
- 有用
データカタログの製品によっては、デフォルトで予め設定されているものもあります。例えば、Cloud Pak for Data(CP4D)のWatson Knowledge Catalog(WKC)では、以下の分類が事前に定義されています。
Personally Identifiable Information
個人を特定できる情報(PII)とは、特定の個人を識別できる可能性のあるあらゆるデータと定義されています。ある個人と別の個人を区別するために使用できる情報はすべて、PIIと見なされます。Sensitive Personal Information
機微な個人データとは、人種または民族的な出自、政治的意見、宗教的信条またはその他の類似した性質の信条、労働組合への加入、身体的または精神的な健康状態または状態、性生活、または個人の犯罪歴または犯罪容疑歴に関する情報で構成される個人データと定義されています。Confidential
機密データとは、何らかの形で危殆化した場合に、そのデータが属する機関および/または個人に重大かつ/または長期的な危害をもたらす可能性のあるデータをいいます。新しい分類の作成方法
ここでは、IBM Cloud Pak for Data(CP4D)のWatson Knowledge Catalog(WKC)を例に、新しい分類の作成方法をご紹介します。
CP4Dにログインした直後の画面です。
左上にあるメニューボタンを押して、ガバナンス -> 分類を選択します。
右上にある新規分類 -> 新規分類作成を押します。なお、今回はご紹介しませんが、分類のファイルインポートも対応しています。
分類名とその分類が属するカテゴリーを選択します。また、その分類の定義を記入し、ドラフトとして保存を選択します。
分類がドラフトとして保存されました。CP4DのWKCは、分類は公開済とドラフトの状態で管理されます。ドラフトの状態場合、ユーザーには見えない状態となっています。
分類は、1次カテゴリーとしてメインのカテゴリーの他に、複数のカテゴリーに2次カテゴリーとして保存することができます。
これ以外にも、親分類や従属分類を設定することができます。ここではブランクのままにします。
コメントを残して、公開するボタンを押すと、分類がドラフト状態から公開済みとなります。
デフォルトの設定では、公開ボタンを押すと、そのまま公開済みになりますが、CP4DのWKCのワークフロー機能を利用すれば、適切な承認プロセスを経て、分類を公開するようなフローを作成することもできます。
以上で、分類を作成いたしました。