2
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

店舗売上、商品、配送データをデータ・ビジュアライゼーションしてみましょう

Last updated at Posted at 2016-09-07

シナリオ

4つの地域でスマートフォンおよびデスクトップPCを店舗販売している家電量販店を想定しています。特定の店舗について販売数と、配送時間が平均より長い理由をデータ・ビジュアライゼーションで調査したいと考えています。データは、売上実績、商品、店舗、配送実績などを利用します。

目的

  • Oracle Data Visualization Desktop (もしくはCloud Service)を使用して外部データ・ファイルから様々なビジュアルを作成する方法を簡単に操作頂きます。
  • また、データを制限するためのフィルタおよび計算式をメジャー(新たな数値項目)として再利用できるようにし、他の人に分かりやすく共有するためのストーリーボートの記入方法まで実施します。
  • 所要時間は45分程度です。是非、こちらにチャレンジ頂いてご自身のお手元のデータを活用できるようになれるようマスターしてください。

ハンズオン概要

Oracle Data Visualization Desktop (もしくはCloud Service)では、意味のある様々なビジュアルを使用してデータを調べ、より多くのビジネスの気づきをもたらすことができます。単一のスプレッドシートを調べることも、スプレッドシート間に一致するデータ要素があれば複数のスプレッドシートを調べることもできます。ファクトが含まれるスプレッドシートもあれば、属性が含まれるスプレッドシートもあります。

  • ファクト(メジャー:)列: これらの列にはデータ値(通常は数値)の単純なリストが格納されます。合計や平均などの集計ルールを適用できます。たとえば、RevenueやUnitsです。
  • ディメンション(属性)列: メジャーを表す値(メンバー)のリストが格納されます。これらは、合計、平均、件数などの集計対象となるファクトのカテゴリです。たとえば、Year、Item Type、State、Cityなどです。

ファクトとディメンションを組み合せることで、データに意味を持たせます。たとえば、Revenue by Month (月別収益)、Revenue by State (州別収益)、Revenue by Store (店舗別収益)です。RevenueファクトがMonth、State、Storeとの一意の組合せごとに合計されます。

スプレッドシートからデータをアップロードする際の注意点:

  • 個々のファクトは一意であっても構いませんが、一意である必要はありません。つまり、同じファクトが何度も出現することがあります。たとえば、ある品目が同じ日に同じ店から何度も販売されることがあります。
  • 通常、ファクトはロール・アップおよび集計されます。
  • ディメンションのメンバーは一意にする必要があります。Item Id、Store Id、Order Numberなどの列には、一意の値が必要です。
  • ディメンションのメンバーは集計できません。

したがって、スプレッドシートをアップロードする際に、そのファイルによってファクトを追加するのか、ディメンションを拡張するのかを選択します。集計を要する列がファイルに含まれている場合、そのファイルではファクトが追加されます。集計が意味をなさない列しかファイルに含まれていない場合、そのファイルではディメンションが拡張されます。

前提条件

このチュートリアルを始める前に次の用意をする必要があります。

    • Oracle Data Visualization Desktopインストール もしくはData Visualization Cloud Serviceへのアクセス権
    • サンプル・データ・ソースfiles.zipここからダウンロードします。コンピュータ上のフォルダにfiles.zipを解凍します。フォルダ・パスを書き留めます。ダウンロードを終了すると、次のスプレッドシート・ファイルが存在します。
      • PCW15 F Sales.xlsx
      • PCW15 D Items.xlsx
      • PCW15 D Calendar.xlsx
      • PCW15 D Stores.xlsx
      • PCW15 F Deliveries.xlsx
      • PCW15 D Warehouse.xlsx

接頭辞'F'が付いているファイルはすべてファクト・ファイルであり、'D'が付いているファイルはすべてディメンション・ファイルです。

新規プロジェクトの作成

この項では、Oracle Data Visualization Cloud Serviceにサインイン(もしくはDesktop版はこちらよりインストール )して、新しいプロジェクトを作成します。

サインイン

  1. ブラウザで、Oracle CloudページへのURLを入力します。ドメイン名を入力します。ドメイン名を保存する場合は、「Save your identity domain selection for future sign-ins」をクリックします。「Go」をクリックします。
    ドメイン名
  2. ユーザー名とパスワードを入力し、「Sign In」をクリックします。
    DVCSの「Sign In」ページ
  3. Oracle Data Visualization Cloud Serviceの「Home」ページが表示されます。ここでは、お気に入りや直近に使用した既存のプロジェクトにアクセスしたり、新しいプロジェクトを作成できます。DVCSの「Home」ページ

新規プロジェクトの作成

この項では、新しいプロジェクトを作成して、スプレッドシート・ファイルを追加します。

  1. 「Create」セクションで、「VA Project」をクリックします。
    DVCSの「Home」ページ
  2. 「Add Source」ダイアログ・ボックスで、「Upload File」をクリックしてスプレッドシート・ファイルをアップロードします。「Create VA Project」ウィンドウ
  3. 「Upload a File」ウィンドウで、「Select File」をクリックします。
    「Upload a File」ウィンドウ
  4. files.zipを解凍したフォルダからスプレッドシートPCW15 F Sales.xlsxを開きます。
    ファイルのオープン
  5. 「Source Name」および「Description」の値は変更できます。ソース名をF Salesに変更します。「Upload a File」ウィンドウ
  6. 数値列がすべてメジャーとして表示されています。次の列を「Measure」から「Attribute」に変更します。「Upload a File」ウィンドウ「Upload a File」ウィンドウ
    • Store Id
    • Item Id
  7. 「Add to Project」をクリックしてスプレッドシートをプロジェクトに含めます。
    「Upload a File」ウィンドウ
  8. これで、スプレッドシートがデータ要素とともに「Data Elements」ペインに表示されます。データ要素を使用して問合せを作成できます。Oracle Visual Analyzerには、多数のビジュアル・タイプがあります。ビジュアルは自分で選択することも、キャンバスに追加する一連のデータ要素に対して最適なビジュアル・タイプがOracle Visual Analyzerによって選択されるようにすることもできます。[Ctrl]キーを使用して、「Sales Date」および「Revenue」を選択し、右クリックしてドロップダウン・メニューから「Create Best Visualization」を選択します。
    スプレッドシートのデータ要素
    Oracle Visual Analyzerによって自動的に最適なビジュアルが作成され、属性およびメジャーを配置するのに最適な位置が選択されます。この場合は、折れ線グラフが作成されます。最適なビジュアル

インサイトの追加

この項では、プロジェクトをインサイトとして追加します。後で使用するビジュアルがある場合は、その時点でのプロジェクトの状態をインサイトとして保存します。インサイトでは、データのスナップショットは取らず、その時点でのプロジェクト定義のスナップショットのみを取ります。他のユーザーが同じインサイトを表示した場合でも、データに対して異なる権限を持っていれば、異なる結果が表示されることがあります。インサイトはライブですが、他のユーザーと共有する前であれば編集できます。複数のインサイトを組み合せ、プロジェクトに対する1つのストーリにすることができます。途中でさらにインサイトを追加できます。

  1. 「Insights」ペインをクリックします。
    Insights
  2. 「Add Insight」をクリックします。現行プロジェクトのインサイトがInsight1として追加されます。
    インサイトの追加 インサイト名
    ベタ塗りの三角形は、選択したインサイトがプロジェクトの現在の状態と一致することを示しています。プロジェクトがインサイトの現在の状態から変わると、三角形は白抜きになります。これは、ストーリを作成してナビゲートする際に便利です。同じベタ塗/白抜き処理は、ストーリ・ナビゲータの現在のステップを表す円にも当てはまります。ストーリの作成の詳細は後述します。
  3. 名前のInsight1を更新するために、「Edit」をクリックします。説明を追加することもできます。
    インサイト名の編集
  4. 名前をRevenue by Sales Dateに変更します。
    「Revenue by Sales Date」インサイト

スプレッドシート・ファイルのアップロードおよびブレンディング

この項では、さらに属性ファイルをアップロードして、データに意味を持たせます。Items、CalendarおよびStoreの各ファイルをアップロードします。Itemsスプレッドシートには、品目に関する情報が含まれています。Calendarスプレッドシートには、月、四半期および年とともに日が含まれています。Storesスプレッドシートには、店舗に関する情報が含まれています。

Itemsスプレッドシートのアップロード

  1. 「Data Sources」ペインを選択してItemsスプレッドシート・ファイルをアップロードします。
    スプレッドシートのアップロード
  2. 「Add Data Source」をクリックします。
    データ・ソースの追加
  3. 「Add Source」ダイアログ・ボックスで、「Upload File」をクリックします。
    ファイルのアップロード
  4. 「Select File」をクリックして、files.zipを解凍したフォルダからスプレッドシートPCW15 D Items.xlsxを選択します。

    ファイルの選択
  5. ソース名をD Itemsに変更します。
    「Upload a File」ウィンドウ
  6. このプロジェクトに別のデータ・ソースがすでに含まれている場合、「File Data will Add Facts」リンクが表示されます。これは、D Itemsに「RRP」という数値列が含まれているためです。数値は頻繁に集計されますが、それはファイルがファクトであることを意味します。この場合、「RRP」は各品目の価格を示す属性です。これは、「Category」や「Item Type」によく似ています。ソースの列をすべて属性に変更するには、「File Data will Add Facts」「File Data will Extend a Dimension」に変更します。これがプロジェクトで最初のデータ・ソースの場合、このリンクは表示されず、「RRP」列に移動して属性に変更する必要があります。
  7. ディメンションの拡張
  8. 「Item Id」のドロップダウン・リストをクリックします。「Item Id」データ要素はSalesスプレッドシートから自動的に選択されています。これは、列名およびデータ型が両方のファイルで一致しているためです。
    一致するデータ要素
  9. 列名をクリックして「RRP」データ要素を除外します。
    スプレッドシートのデータ要素
  10. これで変更はすべて行ったので、「Add to Project」をクリックします。
    プロジェクトへの追加
  11. 「D Items」スプレッドシートがプロジェクトに追加され、「F Sales」スプレッドシートとともに問合せの準備ができました。
    D Itemsのデータ要素

Calendarスプレッドシートのアップロード

  1. 「Data Elements」ペインで、右クリック・メニューから「Add Data Source」を選択します。
    Calendarのアップロード
  2. 「Upload File」をクリックしてCalendarスプレッドシートをアップロードします。
    ファイルのアップロード
  3. files.zipを解凍したフォルダからスプレッドシートPCW15 D Calendar.xlsxファイルを開きます。ソース名をD Calendarに変更します。Calendarのデータ要素
  4. ファクト表には属性を含めることができますが、ディメンションにはメジャーを含めることはできません。このファイルにはメジャーが含まれていないため、「File Data will Extend a Dimension」に変更します。「Add to Project」をクリックしてファイルを既存のプロジェクトに含めます。
    ディメンションの拡張注意: ファイルのアップロード時に、データ要素をマッチングすることをお薦めします。この場合、アップロード時にデータ要素が「F Sales」とマッチングされなかったため、「D Calendar」「Data Elements」ペインに表示されません。「Data Elements」ペイン
  5. しかし、ファイルはプロジェクトで使用可能です。アップロード時にマッチングするのを忘れた場合でも、ファイルのアップロード後にデータ要素をマッチングできます。「Data Sources」ペインをクリックし、「D Calendar」ファイルが存在することを確認します。
    「Data Elements」ペイン
  6. 一番下の「Source Diagram」をクリックして、スプレッドシート間の一致を表示します。
    「Add Data Source」ペイン
  7. 「Source Diagram」に、「F Sales」「D Items」のスプレッドシート間に1件の一致、「F Sales」「D Calendar」のスプレッドシート間に0件の一致が表示されています。マウスを数字の上に置くと、一致するデータ要素が表示されます。
  8. ソース・ダイアグラム
  9. 「F Sales」「D Calendar」の間のリンクをクリックします。両方のスプレッドシート名が表示された「Connect Sources」ダイアログ・ボックスが表示されます。「Add Another Match」をクリックします。
    データ要素のマッチング
  10. 「Connect Sources」ダイアログ・ボックスで、「D Calendar」「Select Column」をクリックして「Day Date」を選択します。同様に、「F Sales」から「Sales Date」を選択します。「OK」をクリックします。
    データ要素のマッチング
  11. 今度は「Source Diagram」に、「D Items」「D Calendar」の両方が「F Sales」に関連付けられた状態で表示されます。ダイアグラムを閉じます。ソース・ダイアグラム
  12. 「Data Elements」ペインを選択します。「D Calendar」がリストに表示され、他のスプレッドシートとともに探索の準備ができました。
    Calendarのデータ要素

Storesスプレッドシートのアップロード

  1. 右クリック・メニューから、「Add Data Source」をクリックします。
    Storesスプレッドシートのアップロード
  2. 「Upload File」をクリックします。
    データ・ソースの追加
  3. files.zipを解凍したフォルダからスプレッドシートPCW15 D Stores.xlsxを選択して開きます。ソース名をD Storesに変更します。Storesのデータ要素
  4. D Storesには店舗の属性が含まれ、メジャーが含まれていないため、「File Data will Extend a Dimension」に変更します。
    ディメンションの拡張;
  5. 「Store Id」の名前およびデータ型が「F Sales」スプレッドシートで一致するため、「Store Id」が一致するデータ要素として自動的に選択されています。
    データ要素のマッチング
  6. 「Add to Project」をクリックします。これでファイルは「Data Elements」ペインに表示され、問合せの準備ができました。
    Storesのデータ要素
  7. 「Data Sources」「Source Diagram」を選択します。スプレッドシートはすべて「F Sales」スプレッドシートとマッチングされています。ソース・ダイアグラム

ある期間にわたるRevenueに関するビジュアルの作成

この項では、様々なビジュアルを作成して、ロードしたばかりのデータを探索します。

  1. 「D Item」 > 「OS」を既存の折れ線グラフに追加するには、列を「Color」にドラッグします。
    「Date Elements」ペイン折れ線グラフが更新れます。「Revenue by Sales Date, OS」グラフ
  2. 「Sales Date」データ要素は値が多すぎて表示できないため、「D Calendar」データ・ソースの「As Month」データ要素で置き換えます。これで年別の月次データが表示されます。October 2013年10月に全製品ついて収益が落ちています。これは、米国政府が2週間閉鎖され、株式市場が機能停止に陥ったためです。「Revenue by As Month, OS」グラフ
  3. このビジュアルをインサイトとして追加します。Government Shutdownと名前を付けます。
    「Government Shutdown」インサイト
  4. トレンド・ラインを挿入し、ここ何年かの間で製品の売上におけるトレンドを観察します。ビジュアル・ツールバーで、「Action」をクリックして「Add Trend Line」を選択します。トレンド・ラインの追加Windowsの売上が横ばいのままである一方、スマートフォンおよびMac製品は上向き傾向にあることがわかります。
    トレンド・ライン
  5. このビジュアルをインサイトとして追加します。Trend in Item Saleと名前を付けます。
    Trend in Item Sales
  6. トレンド・ラインを削除します。ビジュアル・ツールバーで、「Action」「Properties」の順にクリックします。「Analytics」をクリックして「Trend」を削除します。トレンド・ラインの削除
  7. 「OS」「D Stores」 > 「State」で置き換えます。9月/10月頃、一部の州について売上がまた下がっています。何が起きたか調べましょう。「Revenue by As Month, State」グラフ
  8. ビジュアルで2012年のすべての月を選択して、マーキー選択を作成します。
    マーキー選択
  9. 「Action」をクリックしてドロップダウン・メニューから「Keep Selected」を選択します。マーキー選択
  10. 2012年の月のみを使用してフィルタが作成されます。「D Stores」 > 「City」を「Color」に追加します。収益が4つの市で落ちています。収益が落ちた理由を調べましょう。「Revenue by As Month, State, City」グラフ
  11. 「D Stores」 > 「City」に対してピボット表を作成します。折れ線グラフで、収益が落ちた4つの市を選択します。これらの市の名前がピボット表で強調表示されています。これらは、New York州の海岸沿いの都市です。これらの市はすべてハリケーンSandyによる大きな影響が出た際、ハリケーンのせいで収益が打撃を受けました。ピボット表の追加
  12. このビジュアルをインサイトとして追加します。インサイトにStores Impacted by Hurricane Sandyと名前を付けます。
    「Stores Impacted by Hurricane Sandy」

配送実績に関するビジュアルの作成

この項では、倉庫から店舗までの品目の配送実績を調べます。スプレッドシートをさらに2つアップロードします。Deliveriesスプレッドシートには配送の詳細情報が含まれ、Warehouseスプレッドシートには倉庫の場所の詳細情報が含まれています。

DeliveryスプレッドシートとWarehouseスプレッドシートのアップロード

    1. 「スプレッドシート・ファイルの追加アップロード」の手順に従って、PCW15 F Deliveriesスプレッドシートを開きます。このスプレッドシートには配送の詳細情報が含まれているため、ファクトを追加することになります。ソース名をF Deliveriesに変更します。スクロールして列をすべて確認します。データ型および列名が両方のスプレッドシートで同じであるため、「Order #」が自動的に「F Sales」 > 「Order #」とマッチングされます。「Order Date」は、「F Sales」 > 「Sales Date」とマッチングする必要があります。「Order Date」「Match」をクリックします。

Deliveriesスプレッドシートのアップロード

  1. 「Sales Date」を選択して「Order Date」とマッチングします。
    データ要素のマッチング
  2. 「F Deliveries」 > 「Delivery Store Id」「F Sales」 > 「Store Id」をマッチングします。「Add to Project」をクリックします。
    データ要素のマッチング
  3. 「F Deliveries」スプレッドシートは問合せの準備ができました。
    F Deliveriesのデータ要素
  4. ソース・ダイアグラムを確認します。
    ソース・ダイアグラム
  5. Warehouseスプレッドシートをアップロードします。ソース名をD Warehouseに変更します。「File Data will Extend a Dimension」に変更し、「Add to Project」をクリックします。Warehouseスプレッドシートのアップロード
  6. 「Data Elements」ペインを選択します。「D Warehouse」スプレッドシートは問合せの準備ができました。
    「Data Elements」ペイン

計算の作成

この項では、配送日と販売日の日数差(倉庫から店舗まで品目を配送するのにかかる期間)を示す計算済アイテムを作成します。

  1. 「Data Element」ペインで「Add Calculation」をクリックします。
    計算の追加
  2. 「Display Name」にDays_to_Deliverと入力し、「Aggregate」関数から「Avg」関数を選択します。計算の命名
  3. exprパラメータを選択して、「Calendar/Date」を開きます。
    「Avg」関数の選択
  4. 「TIMESTAMPDIFF」関数をダブルクリックして、次のようにパラメータを更新します。Avg(TIMESTAMPDIFF(SQL_TSI_DAY, Sales Date, Delivery Date))関数を検証して保存します。パラメータの入力、検証および保存
  5. 計算済アイテムが「My Calculations」の下に表示されます。この計算済アイテムは他のデータ要素と同じように使用できます。
    「Data Elements」ペイン

市の配送日数の探索

  1. 既存のビジュアルおよびフィルタをすべて削除します。キャンバス・ツールバーで、「Action」をクリックし、「Clear Canvas」を選択してビジュアルをすべて削除します。フィルタの「Action」メニューから「Remove Filter」を選択します。
  2. ビジュアルの削除ビジュアルの削除
  3. 各市の品目の配送にかかる平均日数を調べます。次のような積上げ棒グラフを作成します。「Revenue by Sate, City, Days_to_Deliver」グラフ
  4. CaliforniaおよびNew Yorkでは、様々な市との間の配送時間が著しくばらついています。Californiaでは、Long Beachが最も速く、San Diego、San Franciscoの順に続きます。その理由は、La Puenteの倉庫がLong Beachに非常に近く、San Diegoからはそれほど遠くなく、San Franciscoからは遠く離れているためです。しかし、倉庫が2つあって店舗はすべて倉庫に非常に近いNew York州の事象には、同じ論理が当てはまりません。RochesterとBuffaloで配送時間が比較的長い原因には何があるでしょうか。次のようなピボット表を作成します。ピボット表の追加
  5. データをさらに探索する前に、観察結果をインサイトに保存します。Delivery Time by Cityと名前を付けます。
    インサイトの追加
  6. ピボット表を削除します。New Yorkについてのみデータを探索しているため、「D Stores」 > 「City」に対してフィルタを追加し、New Yorkの店舗をすべて含めます。「City」をクリックし、右クリック・メニューから「Create Filter」を選択します。フィルタで、New Yorkの市をすべてクリックします。
    フィルタの作成3つの市の選択
  7. 次のような積上げ棒ビジュアルを作成します。BuffaloRochesterの店舗について、極寒の気候のため、冬の1月から3月に配送時間が長くなっています。Manhattanは、比較的温暖な気候であるため、配送時間は年間を通して一定しています。「Days_to_Deliver by As Month, Qtr,City」グラフ
  8. このビジュアルをインサイトとして追加します。Delivery Time for New York Citiesと名前を付けます。
    インサイトの追加
  9. 「Revenue by Sales Date」インサイトを削除します。プロジェクトの保存
  10. プロジェクトをRevenue and Delivery Timeとして保存します。
    プロジェクトの保存

プレゼンテーション用のストーリの作成

この項では、これまで追加してきたインサイトをすべて使用してストーリを作成します。

  1. 5つのインサイトがあります。キャンバス・ツールバーで、「Story Navigator」をクリックします。ストーリには、すでに追加した5つのインサイトがあります。各インサイトは青い円として表示されます。デフォルトでは、現在のインサイトが表示されます。
  2. Story Navigator
  3. 追加されたストーリ・ライン
  4. 「Government Shutdown」をクリックし、キャンバスに表示します。
    「Revenue by Sales Date」インサイトのクリック「Revenue by Sales Date」インサイト
  5. ストーリは、次のように「Menu」Menuを使用して変更できます。「Delivery Time by City」をクリックし、キャンバスに表示します。
    「Revenue by Sales Date」インサイトのクリック
    • Edit: タイトルを編集します
    • Include in Story: インサイトを含めます
    • Remove: インサイトを削除します
    • Show Title: タイトルを表示/非表示にします
    • Show Description: 説明を表示/非表示にします。
  6. キャンバス・ツールバーで、「Presentation mode」アイコンをクリックしてストーリをプレゼンテーション・モードでプレビューして確認します。プレゼンテーション・モードでの表示
  7. プレゼンテーション・モードは、ダッシュボードに似ており、ビジュアルを編集できません。他のユーザーとプロジェクトを共有する場合、表示のみのユーザーは、ストーリがなくてもプロジェクトはプレゼンテーション・モードで表示されます。レポート作成者は、ツールバーのプレゼンテーション・ボタンを使用してプレゼンテーション・モードを解除することができます。

プレゼンテーション・モードでの表示

以上で終了です!!

2
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?