データのショッピング(必要なデータの選択)(第5回)
記事の内容
WKCの主要な機能を記載いたします。
• データユーザの作成(第1回)
• カタログ・プロジェクトを作成する(第2回)
• データアセットの探索、カタログ化する(第3回)
• データアセットの理解とソーシャル化(第4回)
• データのショッピング(必要なデータの選択)(第5回)(当記事)
• アナリティックスやAIで必要なデータの準備(第6回)
• 機微(センシティブ)なデータの保護(第7回)
本記事は、上記のデータアセットの理解とソーシャル化(第4回) の続きです。
このタスクでは、カタログのインテリジェント機能であるShop for Data AI-poweredを活用して、推奨してくれた関連性の高い資産を確認します。カタログ内の資産として、資産タイプとタグのフィルター機能も活用します。タグ付けは、資産をカタログ化する際には不可欠なものです。データ利用者が目的の資産を簡単に検索できるようになります。
公式ドキュメント
IBM Cloud Pak for Dataの公式ドキュメントはこちらをご参照ください。
本編
提案を使用したショッピング
「Watsonの推奨」、「高評価」、「最新の追加」セクションを使用して、データを簡単に検索することができます。これらのカテゴリーには、カタログ、キュレーションなど豊富なデータ資産として自動的にデータが取り込まれます。
検索を使用したショッピング
このセクションでは、カタログ資産ブラウザーの検索エリアを使用して、検索条件を指定することにより、データを検索します。検索条件には、大文字/小文字の区別はありません。
- 検索エリアで、「ドキュメント」と入力します。
タグ/資産名/説明から検索条件に適合するデータ資産が表示されます。 - 「x」を押して、検索条件を削除します。
- 検索エリアで、「データウェア」と入力します。
タグ/資産名/説明から検索条件に適合するデータ資産が表示されます。ここでは、自動車保険DBが表示されます。 - 「x」を押して、検索条件を削除します。
- 検索エリアに「claim」と入力します。
タグ/カラム名/資産名/説明から検索条件claimに適合するデータ資産が表示されます。
自動車保険証書テーブルは、claim を含むカラム名、「LAST_CLAIM」、「DENIED_CLAIMS」、「CLAIMS_FILED」が検索条件に適合しているため表示されております。 - 「x」をクリックして、検索条件を削除します。
フィルターを使用した検索
このセクションでは、フィルターを使用することで、データ資産が自動的に絞り込まれることを確認します。
始める前に、検索エリアがクリアになっていることを確認してください。また、Watsonの推奨などのエリアが省略されていることも確認してください。もし、表示されている場合は、省略をクリックしてください。
- 任意のタイプと書かれているフィルターから、データ資産を選択します。
データ資産タイプの5つが表示されます。2つのファイルと3つの表が表示されています。カタログで管理できる他のタイプは、接続、モデル、ノートブックおよびダッシュボードになります。
- すべてのタグのフィルターで、「ドキュメント」を選択します。
ドキュメントタグが付いているデータ資産のみが表示されます。 - 「すべてを消去」をクリックしてください。
次のハンズオン
次は、アナリティックスやAIで必要なデータの準備(第6回)です。