-
当記事は、こちらのBoxへの接続作成の記事の後続の記事として執筆しました。
-
エクセルはデータを管理するにあたって幅広く使われていますので、このような形でデータカタログに取り込めるのは、組織内のデータ整備をすすめる上で大変有効な使い方ではないかと思われます。
-
Boxの有償版は容量無制限でファイルを格納出来ますので、今後データレイク的な使い方にも使えるのかもしれません。またその際に、どのようなデータがどこにあるのか、という点を把握(メタデータ管理)するにも、データカタログ(この記事ではWatson Knowledge Catalog)は必須と言えるでしょう。
0.前提事項
- Cloud Pak for Data as a Service のサービス(無償のlite planで可)が利用可能な状態であること。
- プラットフォーム接続に、Boxへの接続が作成されていること。
1.データカタログにBoxへの接続を登録
-
続いて、この接続を経てBox内のエクセルファイルを、シート単位で登録します。
2.データカタログにBox上のエクセルファイルをシート単位で登録
-
Boxへの接続、該当するフォルダ、フォルダ内のエクセル、エクセル内のシート、を選択していき、右下の「選択」ボタンが青くなるまで待ってからクリックします。
-
該当するシートが選択された状態になりました。このままだと分かりづらいので、名称等はわかりやすいように変更してみましょう。また、該当するビジネス用語、タグ、分類なども入力してみましょう。
-
変更後
-
カタログ内で、エクセルのシートがこのような状態でメタデータとともに閲覧出来ます。
-
プロファイル(データの統計情報)
今回登録したデータカタログはデータ保護ルールを有効にしていないので、データを登録しても自動的にプロファイルは作成されません。
ボタンをクリックしてプロファイルを作成します。