LoginSignup
0
0

More than 1 year has passed since last update.

CP4DaaSでデータ加工-分析-視覚化を実施してみた(第四回:データ・リファイナリー)

Last updated at Posted at 2022-08-02

概要

本連載では、売上明細のマスタデータや顧客マスターデータなどのデータをIBM Cloud Object Storageにファイル転送及び、Db2 Warehouse on Cloudへロードしたのちに、CP4DaaS上のツールである「データ・リファイナリー」、「ダッシュボード・エディター(IBM Cognos Dashboard Embedded)」「SPSS Modeler」を用いて、データ加工から各商品の売上高、また年度/月度などデータの可視化までを実施する。

記事で用いられる主なツール

第一回:IBM Cloud Object Storageへファイル転送
第二回:Db2 Warehouse on Cloudへロード
第三回:プロジェクト内でデータ接続
第四回:資産をデータ・リファイナリー(整形)(本記事)
第五回:SPSS Modelerを用いてテーブルの結合
第六回:ダッシュボード・エディター(IBM Cognos Dashboard Embedded)を用いてレポート作成

本編

データ・リファイナリーを用いて、データ整形を行う

image.png

データ読み込み

「新規資産」の「データ・リファイナリー」を選択する
image.png

整形するデータを接続したDBから選択する
image.png

プロジェクトにDBを接続しているので、簡単に、データ内容が表示された
image.png

データ加工

続いてこちらの売上明細マスターデータと商品マスター、ショップマスターを結合する。
「新規ステップ」を選択後、「結合」を適用
image.png

結合するデータを選択する。「データ・セットの追加」
image.png

結合するデータとして、「SHOP」を適用する
image.png

データを結合するための「キー」を指定する。本記事では「SHOP_CODE」である。
image.png

結合後に表示する列を選択する
image.png

2つのデータを結合することが確認できた。続いて、商品マスターも同様に結合する。
image.png

データ・リファイナリーでは、列名の変更やデータタイプの変更、置換や重複の削除、空欄の行の削除などもGUIベースで簡単に実施することができる。
image.png
image.png

そして作成したデータのデータ分布や統計結果を「プロファイル」から確認することで、データの信頼性を簡単に確認できる。
image.png

データの視覚化では、多種なグラフタイプを用いて多様な分析を行うことができる。本記事では棒グラフを用いて実施する。
image.png

グラフとして用いるデータなどを選択していくことで柔軟に様々なグラフを表示することができる。
image.png

作成したグラフは、「アクション」からプロジェクトに保存することやローカルPCに保存することも可能であり、簡単にナレッジをシェアすることができる。
image.png

整形したデータを分析として利用ために、「Export current sample data to CSV」にてローカルPCにCSVとして保存することや、プロジェクト内に保存するために「ジョブを保存して作成」を実施することができる。
image.png
image.png

ジョブを作成して実行する際には、以下のように、テーブル名の設定等を行うだけで実施することができる。
image.png
このように整形したデータやグラフを簡単にシェアできることは、データ加工にかかる負担を減らすことができる。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0