0
Help us understand the problem. What are the problem?

posted at

updated at

QuickSightでローデータ提供

はじめに

案件の中には、ローデータを納品する場合もあるかと思います。
弊社ではさらに、”検索機能等を実装したVBAマクロ込みExcel”で納品、という事例ありました。

Office製品依存から脱却するためにも、ファイル納品に代わり、QuickSightでローデータを提供できないか試してみました。

概要

  • QuickSight上でテーブルのビジュアルを用い、CSVダウンロードすれば、やりたいことは適う模様
    • ただし、以下の制限あり
      • 100 万行まで
      • 500 MBまで
    • フィルタで絞り込んだ場合は、絞り込み後のデータがダウンロードされる

使用データ

以前から使っている、東京都 新型コロナウイルス陽性患者発表詳細になります。

作ったダッシュボード

以下のようなダッシュボードを作りました(作り方は割愛します)。

  • ざっと集計されるピボット表があるシート
  • ローデータがそのままある表があるシート

この2シートが参照しているデータは同じものになります。

image.png

image.png

CSVダウンロード

CSVダウンロードをするには、対象を選択して、メニューから選びます。

image.png

すると以下のようなポップアップが出てきて、ダウンロードが行われます。

image.png

PIVOT表をダウンロード

PIVOT表からダウンロードします。元のデータと比べてロードデータが少ないことがわかります。
image.png

ダウンロードされたデータは以下のような形式でした。参照しているデータとは異なり、PIVOT表で表されているデータがダウンロードされていることがわかります。

"公表_年月日","患者_年代","患者_性別","カウント"
"2022-05-11 00:00:00","10代","男性",315
"2022-05-11 00:00:00","10代","女性",251
"2022-05-11 00:00:00","10歳未満","男性",253
"2022-05-11 00:00:00","10歳未満","女性",229
"2022-05-11 00:00:00","20代","男性",703
"2022-05-11 00:00:00","20代","女性",663
"2022-05-11 00:00:00","30代","男性",458
"2022-05-11 00:00:00","30代","女性",412
"2022-05-11 00:00:00","40代","男性",347
"2022-05-11 00:00:00","40代","女性",329
"2022-05-11 00:00:00","50代","男性",190
"2022-05-11 00:00:00","50代","女性",206
"2022-05-11 00:00:00","60代","男性",95
"2022-05-11 00:00:00","60代","女性",103
"2022-05-11 00:00:00","70代","男性",60
"2022-05-11 00:00:00","70代","女性",63
"2022-05-11 00:00:00","80代","男性",30
"2022-05-11 00:00:00","80代","女性",39
"2022-05-11 00:00:00","90代","男性",7
"2022-05-11 00:00:00","90代","女性",11
"2022-05-10 00:00:00","100歳以上","男性",1
"2022-05-10 00:00:00","100歳以上","女性",1
"2022-05-10 00:00:00","10代","男性",281
"2022-05-10 00:00:00","10代","女性",238

...

ローデータをダウンロード

フィルタなし

今回のデータは100万件を超えており、これのダウンロードを試みてみます。

image.png

出力項目は表示されている列でしたが、行に関してはポップアップで出てきた通り、100万行で終わっていました。

image.png

フィルタあり

フィルタ機能を使って絞り込んだ結果でダウンロードできるか、試してみます。これができれば、全件欲しい場合は(手間ですが)分割してダウンロードで可能になります。
今回は「2022年、20-40代、女性、居住地が”都内”でない」としてみました。左上のインサイトで総件数が25,254件であることが確認できます。(対象期間が"2022/1/2"になっているのは、1/1にはフィルタに合致するデータがなかったためです。)

image.png

フィルタがかかった状態の表をダウンロードしてみます。

image.png

image.png

ポップアップ、ダウンロードしたデータ両方とも25,254件(CSVはヘッダ行があるので1行多い)であることがわかりました。
データ件数が多い場合でもフィルタで絞り込んで分割することで、欲しいデータが取得できそうです。

おわりに

今回は、「ローデータを納品する」という案件をQuickSightで出来ないか、という観点で機能を確認してみました。

あまり事例はないかもしれないですが、Office製品依存による色々な課題で苦労されている方は、QuickSightでのサービスで提供、という形もあるかと思います。

Register as a new user and use Qiita more conveniently

  1. You can follow users and tags
  2. you can stock useful information
  3. You can make editorial suggestions for articles
What you can do with signing up
0
Help us understand the problem. What are the problem?