概要
本連載では、売上明細のマスタデータや顧客マスターデータなどのデータをIBM Cloud Object Storageにファイル転送及び、Db2 Warehouse on Cloudへロードしたのちに、CP4DaaS上のツールである「データ・リファイナリー」、「ダッシュボード・エディター(IBM Cognos Dashboard Embedded)」「SPSS Modeler」を用いて、データ加工から各商品の売上高、また年度/月度などデータの可視化までを実施する。
記事で用いられる主なツール
第一回:IBM Cloud Object Storageへファイル転送
第二回:Db2 Warehouse on Cloudへロード
第三回:プロジェクト内でデータ接続
第四回:資産をデータ・リファイナリー(整形)(本記事)
第五回:SPSS Modelerを用いてテーブルの結合
第六回:ダッシュボード・エディター(IBM Cognos Dashboard Embedded)を用いてレポート作成
本編
データ・リファイナリーを用いて、データ整形を行う
データ読み込み
プロジェクトにDBを接続しているので、簡単に、データ内容が表示された
データ加工
続いてこちらの売上明細マスターデータと商品マスター、ショップマスターを結合する。
「新規ステップ」を選択後、「結合」を適用
データを結合するための「キー」を指定する。本記事では「SHOP_CODE」である。
2つのデータを結合することが確認できた。続いて、商品マスターも同様に結合する。
データ・リファイナリーでは、列名の変更やデータタイプの変更、置換や重複の削除、空欄の行の削除などもGUIベースで簡単に実施することができる。
そして作成したデータのデータ分布や統計結果を「プロファイル」から確認することで、データの信頼性を簡単に確認できる。
データの視覚化では、多種なグラフタイプを用いて多様な分析を行うことができる。本記事では棒グラフを用いて実施する。
グラフとして用いるデータなどを選択していくことで柔軟に様々なグラフを表示することができる。
作成したグラフは、「アクション」からプロジェクトに保存することやローカルPCに保存することも可能であり、簡単にナレッジをシェアすることができる。
整形したデータを分析として利用ために、「Export current sample data to CSV」にてローカルPCにCSVとして保存することや、プロジェクト内に保存するために「ジョブを保存して作成」を実施することができる。
ジョブを作成して実行する際には、以下のように、テーブル名の設定等を行うだけで実施することができる。
このように整形したデータやグラフを簡単にシェアできることは、データ加工にかかる負担を減らすことができる。