概要
本連載では、売上明細のマスタデータや顧客マスターデータなどのデータをIBM Cloud Object Storageにファイル転送及び、Db2 Warehouse on Cloudへロードしたのちに、CP4DaaS上のツールである「データ・リファイナリー」、「ダッシュボード・エディター(IBM Cognos Dashboard Embedded)」「SPSS Modeler」を用いて、データ加工から各商品の売上高、また年度/月度などデータの可視化までを実施する。
記事で用いられる主なツール
第一回:IBM Cloud Object Storageへファイル転送
第二回:Db2 Warehouse on Cloudへロード
第三回:プロジェクト内でデータ接続
第四回:資産をデータ・リファイナリー(整形)
第五回:SPSS Modelerを用いてテーブルの結合(本記事)
第六回:ダッシュボード・エディター(IBM Cognos Dashboard Embedded)を用いて可視化
本編
プロジェクト内にSPSS Modelerを追加する
Waton Studioにログイン後、新規資産を選択する
「SPSS Modeler」を選択後、名前などを選択し、作成する
作成後には以下のような画面が表示される。
SPSS Modelerでは、直感的に使用ができるGUIが特徴であり、高度な分析もメニューから簡単に使用にできる。
データ登録
「インポート」の「データ資産」をドラッグ&ドロップする
「データ資産」の名前を必要に応じて変更することもできる
「編集」からデータ資産を定義することができる
「データ資産の変更」にて、加工するデータを選択する
既にプロジェクトにDBを追加しているため、簡単にデータを選択することができる
「スキーマ名」、「表名」を確認し、「保存」を選択。同様にSHOPマスターでも資産の定義を行う。
データ結合
全店舗売上明細データとSHOPデータを結合する。
「レコード操作」から「結合」をドラッグ&ドロップし、その後、データ資産である「全店舗売上明細」、「SHOP」を線で結ぶ
「編集」を選択すると、結合条件を定義づけすることができる
例えば、「入力」では結合するデータの情報、「結合」では結合方法、「フィルター」では表示する列を定義する。
それぞれ定義したのちに「保存」を選択すると、結合されたデータが表示される。
SHOHINデータも同様に実施する。
グラフ化
SPSSでは、加工されたデータからモデリング等の分析を簡単に実施することもできるが、今回は加工されたデータの可視化を目的としているため省略する。
「グラフ」をドラッグ&ドロップし、「結合」と線を結ぶ。その後「編集」にて、グラフ化の詳細を定義づけする。
「図表ビルダーの起動」を選択し、加工されたデータを多種なグラフにより多様な可視化を行うことができる。
出力
「エクスポート」>「データ資産エクスポート」をドラッグ&ドロップし、「編集」にて、データの出力の定義づけする
本記事では、エクスポート先をプロジェクトとして保存するが、ローカルPCに保存する場合は、ファイル名やファイル形式を設定する。
プロジェクトに保存する際は、テーブル名を作成して保存することができる。