シナリオ
4つの地域でスマートフォンおよびデスクトップPCを店舗販売している家電量販店を想定しています。特定の店舗について販売数と、配送時間が平均より長い理由をデータ・ビジュアライゼーションで調査したいと考えています。データは、売上実績、商品、店舗、配送実績などを利用します。
目的
- Oracle Data Visualization Desktop (もしくはCloud Service)を使用して外部データ・ファイルから様々なビジュアルを作成する方法を簡単に操作頂きます。
- また、データを制限するためのフィルタおよび計算式をメジャー(新たな数値項目)として再利用できるようにし、他の人に分かりやすく共有するためのストーリーボートの記入方法まで実施します。
- 所要時間は45分程度です。是非、こちらにチャレンジ頂いてご自身のお手元のデータを活用できるようになれるようマスターしてください。
ハンズオン概要
Oracle Data Visualization Desktop (もしくはCloud Service)では、意味のある様々なビジュアルを使用してデータを調べ、より多くのビジネスの気づきをもたらすことができます。単一のスプレッドシートを調べることも、スプレッドシート間に一致するデータ要素があれば複数のスプレッドシートを調べることもできます。ファクトが含まれるスプレッドシートもあれば、属性が含まれるスプレッドシートもあります。
- ファクト(メジャー:)列: これらの列にはデータ値(通常は数値)の単純なリストが格納されます。合計や平均などの集計ルールを適用できます。たとえば、RevenueやUnitsです。
- ディメンション(属性)列: メジャーを表す値(メンバー)のリストが格納されます。これらは、合計、平均、件数などの集計対象となるファクトのカテゴリです。たとえば、Year、Item Type、State、Cityなどです。
ファクトとディメンションを組み合せることで、データに意味を持たせます。たとえば、Revenue by Month (月別収益)、Revenue by State (州別収益)、Revenue by Store (店舗別収益)です。RevenueファクトがMonth、State、Storeとの一意の組合せごとに合計されます。
スプレッドシートからデータをアップロードする際の注意点:
- 個々のファクトは一意であっても構いませんが、一意である必要はありません。つまり、同じファクトが何度も出現することがあります。たとえば、ある品目が同じ日に同じ店から何度も販売されることがあります。
- 通常、ファクトはロール・アップおよび集計されます。
- ディメンションのメンバーは一意にする必要があります。Item Id、Store Id、Order Numberなどの列には、一意の値が必要です。
- ディメンションのメンバーは集計できません。
したがって、スプレッドシートをアップロードする際に、そのファイルによってファクトを追加するのか、ディメンションを拡張するのかを選択します。集計を要する列がファイルに含まれている場合、そのファイルではファクトが追加されます。集計が意味をなさない列しかファイルに含まれていない場合、そのファイルではディメンションが拡張されます。
前提条件
このチュートリアルを始める前に次の用意をする必要があります。
- Oracle Data Visualization Desktopインストール もしくはData Visualization Cloud Serviceへのアクセス権
- サンプル・データ・ソースfiles.zipをここからダウンロードします。コンピュータ上のフォルダにfiles.zipを解凍します。フォルダ・パスを書き留めます。ダウンロードを終了すると、次のスプレッドシート・ファイルが存在します。
- PCW15 F Sales.xlsx
- PCW15 D Items.xlsx
- PCW15 D Calendar.xlsx
- PCW15 D Stores.xlsx
- PCW15 F Deliveries.xlsx
- PCW15 D Warehouse.xlsx
接頭辞'F'が付いているファイルはすべてファクト・ファイルであり、'D'が付いているファイルはすべてディメンション・ファイルです。
新規プロジェクトの作成
この項では、Oracle Data Visualization Cloud Serviceにサインイン(もしくはDesktop版はこちらよりインストール )して、新しいプロジェクトを作成します。
サインイン
- ブラウザで、Oracle CloudページへのURLを入力します。ドメイン名を入力します。ドメイン名を保存する場合は、「Save your identity domain selection for future sign-ins」をクリックします。「Go」をクリックします。
- ユーザー名とパスワードを入力し、「Sign In」をクリックします。
- Oracle Data Visualization Cloud Serviceの「Home」ページが表示されます。ここでは、お気に入りや直近に使用した既存のプロジェクトにアクセスしたり、新しいプロジェクトを作成できます。
新規プロジェクトの作成
この項では、新しいプロジェクトを作成して、スプレッドシート・ファイルを追加します。
- 「Create」セクションで、「VA Project」をクリックします。
- 「Add Source」ダイアログ・ボックスで、「Upload File」をクリックしてスプレッドシート・ファイルをアップロードします。
- 「Upload a File」ウィンドウで、「Select File」をクリックします。
-
files.zipを解凍したフォルダからスプレッドシートPCW15 F Sales.xlsxを開きます。
- 「Source Name」および「Description」の値は変更できます。ソース名をF Salesに変更します。
- 数値列がすべてメジャーとして表示されています。次の列を「Measure」から「Attribute」に変更します。
- Store Id
- Item Id
-
「Add to Project」をクリックしてスプレッドシートをプロジェクトに含めます。
- これで、スプレッドシートがデータ要素とともに「Data Elements」ペインに表示されます。データ要素を使用して問合せを作成できます。Oracle Visual Analyzerには、多数のビジュアル・タイプがあります。ビジュアルは自分で選択することも、キャンバスに追加する一連のデータ要素に対して最適なビジュアル・タイプがOracle Visual Analyzerによって選択されるようにすることもできます。[Ctrl]キーを使用して、「Sales Date」および「Revenue」を選択し、右クリックしてドロップダウン・メニューから「Create Best Visualization」を選択します。
Oracle Visual Analyzerによって自動的に最適なビジュアルが作成され、属性およびメジャーを配置するのに最適な位置が選択されます。この場合は、折れ線グラフが作成されます。
インサイトの追加
この項では、プロジェクトをインサイトとして追加します。後で使用するビジュアルがある場合は、その時点でのプロジェクトの状態をインサイトとして保存します。インサイトでは、データのスナップショットは取らず、その時点でのプロジェクト定義のスナップショットのみを取ります。他のユーザーが同じインサイトを表示した場合でも、データに対して異なる権限を持っていれば、異なる結果が表示されることがあります。インサイトはライブですが、他のユーザーと共有する前であれば編集できます。複数のインサイトを組み合せ、プロジェクトに対する1つのストーリにすることができます。途中でさらにインサイトを追加できます。
-
「Insights」ペインをクリックします。
-
「Add Insight」をクリックします。現行プロジェクトのインサイトがInsight1として追加されます。
ベタ塗りの三角形は、選択したインサイトがプロジェクトの現在の状態と一致することを示しています。プロジェクトがインサイトの現在の状態から変わると、三角形は白抜きになります。これは、ストーリを作成してナビゲートする際に便利です。同じベタ塗/白抜き処理は、ストーリ・ナビゲータの現在のステップを表す円にも当てはまります。ストーリの作成の詳細は後述します。 - 名前のInsight1を更新するために、「Edit」をクリックします。説明を追加することもできます。
- 名前をRevenue by Sales Dateに変更します。
スプレッドシート・ファイルのアップロードおよびブレンディング
この項では、さらに属性ファイルをアップロードして、データに意味を持たせます。Items、CalendarおよびStoreの各ファイルをアップロードします。Itemsスプレッドシートには、品目に関する情報が含まれています。Calendarスプレッドシートには、月、四半期および年とともに日が含まれています。Storesスプレッドシートには、店舗に関する情報が含まれています。
Itemsスプレッドシートのアップロード
-
「Data Sources」ペインを選択してItemsスプレッドシート・ファイルをアップロードします。
-
「Add Data Source」をクリックします。
- 「Add Source」ダイアログ・ボックスで、「Upload File」をクリックします。
-
「Select File」をクリックして、files.zipを解凍したフォルダからスプレッドシートPCW15 D Items.xlsxを選択します。
- ソース名をD Itemsに変更します。
- このプロジェクトに別のデータ・ソースがすでに含まれている場合、「File Data will Add Facts」リンクが表示されます。これは、D Itemsに「RRP」という数値列が含まれているためです。数値は頻繁に集計されますが、それはファイルがファクトであることを意味します。この場合、「RRP」は各品目の価格を示す属性です。これは、「Category」や「Item Type」によく似ています。ソースの列をすべて属性に変更するには、「File Data will Add Facts」を「File Data will Extend a Dimension」に変更します。これがプロジェクトで最初のデータ・ソースの場合、このリンクは表示されず、「RRP」列に移動して属性に変更する必要があります。
-
「Item Id」のドロップダウン・リストをクリックします。「Item Id」データ要素はSalesスプレッドシートから自動的に選択されています。これは、列名およびデータ型が両方のファイルで一致しているためです。
- 列名をクリックして「RRP」データ要素を除外します。
- これで変更はすべて行ったので、「Add to Project」をクリックします。
-
「D Items」スプレッドシートがプロジェクトに追加され、「F Sales」スプレッドシートとともに問合せの準備ができました。
Calendarスプレッドシートのアップロード
- 「Data Elements」ペインで、右クリック・メニューから「Add Data Source」を選択します。
-
「Upload File」をクリックしてCalendarスプレッドシートをアップロードします。
- files.zipを解凍したフォルダからスプレッドシートPCW15 D Calendar.xlsxファイルを開きます。ソース名をD Calendarに変更します。
- ファクト表には属性を含めることができますが、ディメンションにはメジャーを含めることはできません。このファイルにはメジャーが含まれていないため、「File Data will Extend a Dimension」に変更します。「Add to Project」をクリックしてファイルを既存のプロジェクトに含めます。
注意: ファイルのアップロード時に、データ要素をマッチングすることをお薦めします。この場合、アップロード時にデータ要素が「F Sales」とマッチングされなかったため、「D Calendar」は「Data Elements」ペインに表示されません。 - しかし、ファイルはプロジェクトで使用可能です。アップロード時にマッチングするのを忘れた場合でも、ファイルのアップロード後にデータ要素をマッチングできます。「Data Sources」ペインをクリックし、「D Calendar」ファイルが存在することを確認します。
- 一番下の「Source Diagram」をクリックして、スプレッドシート間の一致を表示します。
- 「Source Diagram」に、「F Sales」と「D Items」のスプレッドシート間に1件の一致、「F Sales」と「D Calendar」のスプレッドシート間に0件の一致が表示されています。マウスを数字の上に置くと、一致するデータ要素が表示されます。
-
「F Sales」と「D Calendar」の間のリンクをクリックします。両方のスプレッドシート名が表示された「Connect Sources」ダイアログ・ボックスが表示されます。「Add Another Match」をクリックします。
- 「Connect Sources」ダイアログ・ボックスで、「D Calendar」の「Select Column」をクリックして「Day Date」を選択します。同様に、「F Sales」から「Sales Date」を選択します。「OK」をクリックします。
- 今度は「Source Diagram」に、「D Items」と「D Calendar」の両方が「F Sales」に関連付けられた状態で表示されます。ダイアグラムを閉じます。
-
「Data Elements」ペインを選択します。「D Calendar」がリストに表示され、他のスプレッドシートとともに探索の準備ができました。
Storesスプレッドシートのアップロード
- 右クリック・メニューから、「Add Data Source」をクリックします。
-
「Upload File」をクリックします。
- files.zipを解凍したフォルダからスプレッドシートPCW15 D Stores.xlsxを選択して開きます。ソース名をD Storesに変更します。
-
D Storesには店舗の属性が含まれ、メジャーが含まれていないため、「File Data will Extend a Dimension」に変更します。
; -
「Store Id」の名前およびデータ型が「F Sales」スプレッドシートで一致するため、「Store Id」が一致するデータ要素として自動的に選択されています。
-
「Add to Project」をクリックします。これでファイルは「Data Elements」ペインに表示され、問合せの準備ができました。
- 「Data Sources」で「Source Diagram」を選択します。スプレッドシートはすべて「F Sales」スプレッドシートとマッチングされています。
ある期間にわたるRevenueに関するビジュアルの作成
この項では、様々なビジュアルを作成して、ロードしたばかりのデータを探索します。
-
「D Item」 > 「OS」を既存の折れ線グラフに追加するには、列を「Color」にドラッグします。
折れ線グラフが更新れます。 - 「Sales Date」データ要素は値が多すぎて表示できないため、「D Calendar」データ・ソースの「As Month」データ要素で置き換えます。これで年別の月次データが表示されます。October 2013年10月に全製品ついて収益が落ちています。これは、米国政府が2週間閉鎖され、株式市場が機能停止に陥ったためです。
- このビジュアルをインサイトとして追加します。Government Shutdownと名前を付けます。
- トレンド・ラインを挿入し、ここ何年かの間で製品の売上におけるトレンドを観察します。ビジュアル・ツールバーで、「Action」をクリックして「Add Trend Line」を選択します。Windowsの売上が横ばいのままである一方、スマートフォンおよびMac製品は上向き傾向にあることがわかります。
- このビジュアルをインサイトとして追加します。Trend in Item Saleと名前を付けます。
- トレンド・ラインを削除します。ビジュアル・ツールバーで、「Action」、「Properties」の順にクリックします。「Analytics」をクリックして「Trend」を削除します。
- 「OS」を「D Stores」 > 「State」で置き換えます。9月/10月頃、一部の州について売上がまた下がっています。何が起きたか調べましょう。
- ビジュアルで2012年のすべての月を選択して、マーキー選択を作成します。
- 「Action」をクリックしてドロップダウン・メニューから「Keep Selected」を選択します。
- 2012年の月のみを使用してフィルタが作成されます。「D Stores」 > 「City」を「Color」に追加します。収益が4つの市で落ちています。収益が落ちた理由を調べましょう。
- 「D Stores」 > 「City」に対してピボット表を作成します。折れ線グラフで、収益が落ちた4つの市を選択します。これらの市の名前がピボット表で強調表示されています。これらは、New York州の海岸沿いの都市です。これらの市はすべてハリケーンSandyによる大きな影響が出た際、ハリケーンのせいで収益が打撃を受けました。
- このビジュアルをインサイトとして追加します。インサイトにStores Impacted by Hurricane Sandyと名前を付けます。
配送実績に関するビジュアルの作成
この項では、倉庫から店舗までの品目の配送実績を調べます。スプレッドシートをさらに2つアップロードします。Deliveriesスプレッドシートには配送の詳細情報が含まれ、Warehouseスプレッドシートには倉庫の場所の詳細情報が含まれています。
DeliveryスプレッドシートとWarehouseスプレッドシートのアップロード
- 「スプレッドシート・ファイルの追加アップロード」の手順に従って、PCW15 F Deliveriesスプレッドシートを開きます。このスプレッドシートには配送の詳細情報が含まれているため、ファクトを追加することになります。ソース名をF Deliveriesに変更します。スクロールして列をすべて確認します。データ型および列名が両方のスプレッドシートで同じであるため、「Order #」が自動的に「F Sales」 > 「Order #」とマッチングされます。「Order Date」は、「F Sales」 > 「Sales Date」とマッチングする必要があります。「Order Date」で「Match」をクリックします。
-
「Sales Date」を選択して「Order Date」とマッチングします。
-
「F Deliveries」 > 「Delivery Store Id」と「F Sales」 > 「Store Id」をマッチングします。「Add to Project」をクリックします。
-
「F Deliveries」スプレッドシートは問合せの準備ができました。
- ソース・ダイアグラムを確認します。
- Warehouseスプレッドシートをアップロードします。ソース名をD Warehouseに変更します。「File Data will Extend a Dimension」に変更し、「Add to Project」をクリックします。
-
「Data Elements」ペインを選択します。「D Warehouse」スプレッドシートは問合せの準備ができました。
計算の作成
この項では、配送日と販売日の日数差(倉庫から店舗まで品目を配送するのにかかる期間)を示す計算済アイテムを作成します。
- 「Data Element」ペインで「Add Calculation」をクリックします。
- 「Display Name」にDays_to_Deliverと入力し、「Aggregate」関数から「Avg」関数を選択します。
-
exprパラメータを選択して、「Calendar/Date」を開きます。
- 「TIMESTAMPDIFF」関数をダブルクリックして、次のようにパラメータを更新します。Avg(TIMESTAMPDIFF(SQL_TSI_DAY, Sales Date, Delivery Date))関数を検証して保存します。
- 計算済アイテムが「My Calculations」の下に表示されます。この計算済アイテムは他のデータ要素と同じように使用できます。
市の配送日数の探索
- 既存のビジュアルおよびフィルタをすべて削除します。キャンバス・ツールバーで、「Action」をクリックし、「Clear Canvas」を選択してビジュアルをすべて削除します。フィルタの「Action」メニューから「Remove Filter」を選択します。
- 各市の品目の配送にかかる平均日数を調べます。次のような積上げ棒グラフを作成します。
- CaliforniaおよびNew Yorkでは、様々な市との間の配送時間が著しくばらついています。Californiaでは、Long Beachが最も速く、San Diego、San Franciscoの順に続きます。その理由は、La Puenteの倉庫がLong Beachに非常に近く、San Diegoからはそれほど遠くなく、San Franciscoからは遠く離れているためです。しかし、倉庫が2つあって店舗はすべて倉庫に非常に近いNew York州の事象には、同じ論理が当てはまりません。RochesterとBuffaloで配送時間が比較的長い原因には何があるでしょうか。次のようなピボット表を作成します。
- データをさらに探索する前に、観察結果をインサイトに保存します。Delivery Time by Cityと名前を付けます。
- ピボット表を削除します。New Yorkについてのみデータを探索しているため、「D Stores」 > 「City」に対してフィルタを追加し、New Yorkの店舗をすべて含めます。「City」をクリックし、右クリック・メニューから「Create Filter」を選択します。フィルタで、New Yorkの市をすべてクリックします。
- 次のような積上げ棒ビジュアルを作成します。BuffaloとRochesterの店舗について、極寒の気候のため、冬の1月から3月に配送時間が長くなっています。Manhattanは、比較的温暖な気候であるため、配送時間は年間を通して一定しています。
- このビジュアルをインサイトとして追加します。Delivery Time for New York Citiesと名前を付けます。
- 「Revenue by Sales Date」インサイトを削除します。
- プロジェクトをRevenue and Delivery Timeとして保存します。
プレゼンテーション用のストーリの作成
この項では、これまで追加してきたインサイトをすべて使用してストーリを作成します。
- 5つのインサイトがあります。キャンバス・ツールバーで、「Story Navigator」をクリックします。ストーリには、すでに追加した5つのインサイトがあります。各インサイトは青い円として表示されます。デフォルトでは、現在のインサイトが表示されます。
-
「Government Shutdown」をクリックし、キャンバスに表示します。
- ストーリは、次のように「Menu」を使用して変更できます。「Delivery Time by City」をクリックし、キャンバスに表示します。
- Edit: タイトルを編集します
- Include in Story: インサイトを含めます
- Remove: インサイトを削除します
- Show Title: タイトルを表示/非表示にします
- Show Description: 説明を表示/非表示にします。
- キャンバス・ツールバーで、「Presentation mode」アイコンをクリックしてストーリをプレゼンテーション・モードでプレビューして確認します。
- プレゼンテーション・モードは、ダッシュボードに似ており、ビジュアルを編集できません。他のユーザーとプロジェクトを共有する場合、表示のみのユーザーは、ストーリがなくてもプロジェクトはプレゼンテーション・モードで表示されます。レポート作成者は、ツールバーのプレゼンテーション・ボタンを使用してプレゼンテーション・モードを解除することができます。
以上で終了です!!