はじめに
Oracle Analytics Cloud(OAC)でセルフサービスBI機能を使用してデータを可視化するときには、最初にデータセットを定義するか、定義済みのデータセットを読み込むことになります。
データセットとは、対象となるデータソースの中から可視化に必要な部分を指定したものです。
データソースとは、データベースまたはファイル(CSVやExcelファイル)と考えて差し支えありません。
データベースからデータセットを作成する場合は、マルチ・テーブル・データセットという機能が従来からありました。
参考:Oracle Analytics Cloud:簡易的なモデリングツールとしてのマルチ・テーブル・データセット
2022年6月現在、ファイルから作成したデータセットでも、複数のファイルを結合することができるようになっています。
試してみること
- 2つのExcelファイルを用意します(Sales.xlsx, Products.xlsx)
- データセットをひとつ作成し、この2つのExcelファイルをアップロードして結合します
- さらに、データベースの表「CHANNELS」をSales.xlsx(のデータ)に結合します
- 作成したデータセットで可視化します
データセットの作成
OACにログインし、「作成」ボタンをクリックし、「データセット」を選択します。
「データセットの作成」ウィンドウの左上、「ここにデータ・ファイルをドロップするか、クリックして参照します」というエリアにExcelファイルをドラッグ&ドロップします。
「OK」をクリックします。
Salesが読み込まれます。次に+マークの「追加」アイコンをクリックして「ファイルの追加」を選択します。
Products.xlxsを選択します。
2つのExcelファイル、Sales.xlsxとProducts.xlsxを単一のデータセット内に読み込むことができました。
(自動的にPROD_ID列で結合もできました)
列名が違っていたり、データタイプが違っていたりすると自動的に結合されませんので、手動で設定します。データタイプの変更等も適宜実施してください。
もう一つ、データを追加します。
今度は、「接続の追加」を選択します。
事前に作成しておいた、Autonomous Data Warehouse用の接続を選択します。
表「CHANNELS」をドラッグ&ドロップして選択します。
列名やデータタイプが一致していれば、自動的に結合されます。
今回は自動的に結合されなかったので、「CHANNELS」を「Sales」の上にドラッグ&ドロップしました。
結合を定義するウィンドウが表示されたので、「Sales」の「CHANNEL_ID」を選択します。
対応する「CHANNELS」の「CHANNEL_ID」を選択したいのですが、データタイプが違っているのか薄いグレーになっています。
構わず選択したところ、この列をメジャーとして認識していたことがわかりました。メジャーではなく属性なので「はい」をクリックします。
データセットを保存します。
作成したデータセットで可視化してみる
「ワークブックの作成」ボタンが表示されている場合はクリックします。
もしくは、「データ」メニューから、保存したデータセットを探してクリックします。
100%積上げ棒グラフを作成してみました。
販売数量はSales.xlsxから、製品カテゴリはProducts.xlsxから、チャネルはデータベースの表「CHANNELS」から取得できました。