AWS QuickSightとは?
AWS QuickSightとはサーバーレスでフルマネージドなBIサービスになります。S3にあるデータはもちろんのことRDS,Athena,Redshift、オンプレミスにあるJDBC接続(JDBC:javaで書かれたプログラムとデータベースの仲立ちをするもの)可能なデータベースのデータなどと連携して可視化を行うことが出来る。SPICEというインメモリ型の高速データベースが内蔵されており、そこにデータを取り込んでおくとデータソースに負荷をかけることなく高速なクエリが可能になる。
QuickSightを実際に使用してみた。
まずはCSVファイルをアップロードします。新しい分析というところをクリックし「新しいデータセット」→「ファイルのアップロード」を選択し分析したいデータをアップロードします。
そうすると下図のような画面になるので問題がなければ「保存して視覚化」を押します。ここではカラム名を変更したり計算フィールドを使用した変更を行ったりすることが出来ます。
次に可視化を行っていきたいと思います。画面の左側にあるフィールドリストには読み込んだデータのカラムがあります。それを使用して可視化を行っていきます。デフォルトで「AutoGraph」となっているため、カラムを選択するだけで自動的にビジュアルタイプを選択してくれます。左上にある「追加(+)」のところで「ビジュアルを追加」というところを選択すると複数のビジュアルを選択することが可能です。
先ほどは「AutoGraph」による自動的な可視化でしたが、自分自身でビジュアルのタイプを選んで可視化したい場合はどのように行うとよいでしょうか?それはビジュアルタイプを自分で選択すれば可能になります。左下にビジュアルタイプがあるので可視化したいタイプを選択します(今回はピボットテーブル)。その次に使用したいフィールドを選択しフィールドウェルの「行」「列」「値」にそれぞれドラッグします。このように簡単にピボットテーブルを作成することが出来ます。
続いてフィルターを使用してみたいと思います。フィルターを使用する事で表示する範囲を絞れたり、特定のものを抽出したりすることが出来ます。フィルターを使用するには左側にあるフィルターを選択します。今回はオーダー日にフィルターをかけたいのでオーダー日を選択し開始日と終了日の設定を行います。そうすると指定した範囲のみの表示を行うことが出来ます。またパラメータを使用した分析を行いたい場合は「パラメータを使用」にチェックすることで使用できます。パラメータの作成は左側にあるパラメータというところでパラメータを作成することによって使用する事が出来ます。
売上への寄与度の分析を行います。売上への寄与度を分析する際には、棒グラフをクリックし、「売上への寄与度を分析」を選択します。そうすることによって左側に分析結果が表示されます。結果を見てみると大阪府が売り上げの増加に一番貢献したということが分かります。
続いて機械学習による予測を行っていきたいと思います。今回は売り上げの予測をしていきます。売り上げの予測も難しいわけではなくクリックだけで実装することが出来ます。「ビジュアルタイプ」に折れ線グラフを選択し可視化しました。その後「…」を押し「予測の追加」を押します。そうするとオレンジ色の予測結果が可視化されます。見方としては、濃いオレンジの実践を中心に薄いオレンジの幅で売上が推移すると予測しています。
このように可視化をするのであればQuickSightは有用であると思います。しかしながら従量課金制であるため、料金には注意が必要になってくると思います。
<参考にさせていただいたサイト>
JDBCとは
AWSではじめるデータレイク: クラウドによる統合型データリポジトリ構築入門