QuickSightを使ってみてどの程度簡単に可視化ができるのかを試しつつ、QuickSightの認証を既存の仕組み(Cognito)を利用して簡略化できないか、という観点で調べてみました。
やりたいこと
- どの程度簡単に可視化できるのかを試したい
- QuickSightの認証を簡略化したい
どの程度簡単に可視化できるのかを試したい
QuickSight用のデータを用いては意味がないので、Elasitcsearch / Kibana可視化用のサンプルデータをQuickSightに読み込ませてどうなるかを試してみたいと思います。
今回利用したサンプルデータはこちら:
Loading sample data - Elasticsearch -
https://www.elastic.co/guide/en/kibana/current/tutorial-load-dataset.html
こちらにある3つのデータセットをQuickSightで可視化してみました。
- The complete works of William Shakespeare, suitably parsed into fields
- A set of randomly generated log files
データの可視化をしてみる
Shakespeare.jsonデータの可視化
データをCSV化する
ダウンロードできるデータは全てJSONデータなので、一旦CSVに変換します。Elasticsearchが読み込める形式になっているので、割と強引に変換をかけます。
必ずインデックス情報が存在するので、一旦削ります。こんな感じのやつを正規表現で削除します。またread_jsonの「orient='records'」で読み込めるように、配列形式に変更します。
{"index":{"_index":"shakespeare","_id":0}}
{"type":"act","line_id":1,"play_name":"Henry IV", "speech_number":"","line_number":"","speaker":"","text_entry":"ACT I"}
{"index":{"_index":"shakespeare","_id":1}}
{"type":"scene","line_id":2,"play_name":"Henry IV","speech_number":"","line_number":"","speaker":"","text_entry":"SCENE I. London. The palace."}
{"index":{"_index":"shakespeare","_id":2}}
{"type":"line","line_id":3,"play_name":"Henry IV","speech_number":"","line_number":"","speaker":"","text_entry":"Enter KING HENRY, LORD JOHN OF LANCASTER, the EARL of WESTMORELAND, SIR WALTER BLUNT, and others"}
{"index":{"_index":"shakespeare","_id":3}}
↓
[{"type":"act","line_id":1,"play_name":"Henry IV", "speech_number":"","line_number":"","speaker":"","text_entry":"ACT I"},
{"type":"scene","line_id":2,"play_name":"Henry IV","speech_number":"","line_number":"","speaker":"","text_entry":"SCENE I. London. The palace."},
{"type":"line","line_id":3,"play_name":"Henry IV","speech_number":"","line_number":"","speaker":"","text_entry":"Enter KING HENRY, LORD JOHN OF LANCASTER, the EARL of WESTMORELAND, SIR WALTER BLUNT, and others"},
{"type":"line","line_id":4,"play_name":"Henry IV","speech_number":1,"line_number":"1.1.1","speaker":"KING HENRY IV","text_entry":"So shaken as we are, so wan with care,"},
はい、これでPandasで読み込める形式になりました。CSV変換をかけます。
import os
import sys
sys.path.append(os.path.join(os.path.abspath(os.path.dirname(__file__)), '../libs'))
import pandas as pd
df = pd.read_json(sys.argv[1], orient='records')
df.to_csv(sys.argv[2], index=False)
line_id,line_number,play_name,speaker,speech_number,text_entry,type
1,,Henry IV,,,ACT I,act
2,,Henry IV,,,SCENE I. London. The palace.,scene
3,,Henry IV,,,"Enter KING HENRY, LORD JOHN OF LANCASTER, the EARL of WESTMORELAND, SIR WALTER BLUNT, and others",line
4,1.1.1,Henry IV,KING HENRY IV,1,"So shaken as we are, so wan with care,",line
5,1.1.2,Henry IV,KING HENRY IV,1,"Find we a time for frighted peace to pant,",line
QuickSightに読み込ませてみる
S3に先ほどのcsvファイルをアップロードして、QuickSightに読み込ませてみます。
QuickSightにはS3の読み込みが可能なように、適当なバケットを作成してファイルをアップロードしました。
可視化の際に読み込ませたManifestファイルは以下になります。
{
"fileLocations": [
{"URIPrefixes":
[
"https://s3.amazonaws.com/quicksight-sample/shakespeare.csv"
]
}
],
"globalUploadSettings": {
"format": "CSV",
"textqualifier": "\"",
"delimiter": ","
}
}
読み込ませたら普通にグラフで可視化することはできました。
まずまず簡単なようです。次に時系列データになるであろうログファイルを使って可視化してみます。
logs.jsonlデータの可視化
同様の手順でQuickSightに読み込めるようにします。(省略)
QuickSightに読み込ませてみる
以下の処理を行ってCSVを作成後、Manifestファイルを作成して読み込ませました。
- JSONリスト化(同上)
- CSV変換(同上)
- ヘッダ名から「@」を除く
- ダブルクォートのエスケープ
message,tags,timestamp,version,agent,bytes,clientip,extension,geo,headings,host,ip,links,machine,memory,phpmemory,referer,relatedContent,request,response,spaces,url,utc_time,xss
"185.124.182.126 - - [2015-05-18T09:03:25.877Z] \"GET /canhaz/gemini-7.gif HTTP/1.1\" 404 804 \"-\" \"Mozilla/5.0 (X11; Linux x86_64; rv:6.0a1) Gecko/20110421 Firefox/6.0a1\"","['success', 'info']",2015-05-18T09:03:25.877Z,1,Mozilla/5.0 (X11; Linux x86_64; rv:6.0a1) Gecko/20110421 Firefox/6.0a1,804,185.124.182.126,gif,"{'coordinates': {'lat': 36.518375, 'lon': -86.05828083}, 'src': 'PH', 'dest': 'MM', 'srcdest': 'PH:MM'}","['<h3>f-i-j-nl-ng</h5>', 'http://facebook.com/success/lodewijk-van-den-berg']",motion-media.theacademyofperformingartsandscience.org,185.124.182.126,"['daniel-tani@facebook.com', 'http://nytimes.com/security/kathryn-sullivan', 'www.nytimes.com']","{'os': 'win xp', 'ram': 3221225472}",,,http://twitter.com/error/william-shepherd,"[{'url': 'http://www.laweekly.com/news/cbs-crew-rat-fink-2368032', 'og:type': 'article', 'og:title': 'CBS Crew Rat Fink', 'og:description': 'Near a couple of auto body shops (and a sharp new Space Invader mosaic that we'll post soon) near Temple and Westmoreland is a CBS wall with a nice Rat ...', 'og:url': 'http://www.laweekly.com/news/cbs-crew-rat-fink-2368032', 'article:published_time': '2008-01-14T08:05:26-08:00', 'article:modified_time': '2014-10-28T14:59:52-07:00', 'article:section': 'News', 'article:tag': 'Mark Mauer', 'og:image': 'http://IMAGES1.laweekly.com/imager/cbs-crew-rat-fink/u/original/2430299/img_2049.jpg', 'og:image:height': '360', 'og:image:width': '480', 'og:site_name': 'LA Weekly', 'twitter:title': 'CBS Crew Rat Fink', 'twitter:description': 'Near a couple of auto body shops (and a sharp new Space Invader mosaic that we'll post soon) near Temple and Westmoreland is a CBS wall with a nice Rat ...', 'twitter:card': 'summary', 'twitter:image': 'http://IMAGES1.laweekly.com/imager/cbs-crew-rat-fink/u/original/2430299/img_2049.jpg', 'twitter:site': '@laweekly'}, {'url': 'http://www.laweekly.com/news/push-and-retna-in-koreatown-2368043', 'og:type': 'article', 'og:title': 'Push and Retna in Koreatown', 'og:description': 'Yeah, I originally had this posted this morning as Push & Ayer - Sorry. It looked like a Retna piece, but I saw the Ayer in there and thought that must ...', 'og:url': 'http://www.laweekly.com/news/push-and-retna-in-koreatown-2368043', 'article:published_time': '2008-01-29T07:28:32-08:00', 'article:modified_time': '2014-10-28T14:59:54-07:00', 'article:section': 'News', 'article:tag': 'Shelley Leopold', 'og:image': 'http://IMAGES1.laweekly.com/imager/push-and-retna-in-koreatown/u/original/2430376/img_3671.jpg', 'og:image:height': '360', 'og:image:width': '480', 'og:site_name': 'LA Weekly', 'twitter:title': 'Push and Retna in Koreatown', 'twitter:description': 'Yeah, I originally had this posted this morning as Push & Ayer - Sorry. It looked like a Retna piece, but I saw the Ayer in there and thought that must ...', 'twitter:card': 'summary', 'twitter:image': 'http://IMAGES1.laweekly.com/imager/push-and-retna-in-koreatown/u/original/2430376/img_3671.jpg', 'twitter:site': '@laweekly'}, {'url': 'http://www.laweekly.com/news/asylm-ruets-pdb-on-santa-monica-2368012', 'og:type': 'article', 'og:title': 'Asylm, Ruets, PDB on Santa Monica', 'og:description': 'Not a new piece, but a well-hidden gem a little south of Santa Monica Blvd. in an alley off of Heliotrope or Edgemont. I've been sitting on this for a w...', 'og:url': 'http://www.laweekly.com/news/asylm-ruets-pdb-on-santa-monica-2368012', 'article:published_time': '2008-04-22T15:11:15-07:00', 'article:modified_time': '2014-10-28T14:59:48-07:00', 'article:section': 'News', 'article:tag': 'Culture and Lifestyle', 'og:image': 'http://images1.laweekly.com/imager/asylm-ruets-pdb-on-santa-monica/u/original/2430137/img_5027.jpg', 'og:image:height': '360', 'og:image:width': '480', 'og:site_name': 'LA Weekly', 'twitter:title': 'Asylm, Ruets, PDB on Santa Monica', 'twitter:description': 'Not a new piece, but a well-hidden gem a little south of Santa Monica Blvd. in an alley off of Heliotrope or Edgemont. I've been sitting on this for a w...', 'twitter:card': 'summary', 'twitter:image': 'http://images1.laweekly.com/imager/asylm-ruets-pdb-on-santa-monica/u/original/2430137/img_5027.jpg', 'twitter:site': '@laweekly'}, {'url': 'http://www.laweekly.com/news/laurence-tribe-tangles-with-cbs-and-la-city-hall-2396867', 'og:type': 'article', 'og:title': 'Laurence Tribe Tangles with CBS and L.A. City Hall', 'og:description': 'The United States Court of Appeals for the Ninth Circuit’s Courtroom 3 - a miniature auditorium with comfortable, smoked salmon-colored seats - wa...', 'og:url': 'http://www.laweekly.com/news/laurence-tribe-tangles-with-cbs-and-la-city-hall-2396867', 'article:published_time': '2008-06-04T14:16:10-07:00', 'article:modified_time': '2014-11-26T14:43:59-08:00', 'article:section': 'News', 'og:site_name': 'LA Weekly', 'twitter:title': 'Laurence Tribe Tangles with CBS and L.A. City Hall', 'twitter:description': 'The United States Court of Appeals for the Ninth Circuit’s Courtroom 3 - a miniature auditorium with comfortable, smoked salmon-colored seats - wa...', 'twitter:card': 'summary', 'twitter:site': '@laweekly'}]",/canhaz/gemini-7.gif,404,this is a thing with lots of spaces wwwwoooooo,https://motion-media.theacademyofperformingartsandscience.org/canhaz/gemini-7.gif,2015-05-18 09:03:25.877,"<script>console.log(\"xss\")</script>"
"79.1.14.87 - - [2015-05-18T12:28:25.013Z] \"GET /canhaz/james-mcdivitt.gif HTTP/1.1\" 200 774 \"-\" \"Mozilla/5.0 (X11; Linux i686) AppleWebKit/534.24 (KHTML, like Gecko) Chrome/11.0.696.50 Safari/534.24\"","['success', 'info']",2015-05-18T12:28:25.013Z,1,"Mozilla/5.0 (X11; Linux i686) AppleWebKit/534.24 (KHTML, like Gecko) Chrome/11.0.696.50 Safari/534.24",774,79.1.14.87,gif,"{'coordinates': {'lat': 35.16531472, 'lon': -107.9006142}, 'src': 'GN', 'dest': 'US', 'srcdest': 'GN:US'}","['<h3>charles-bolden</h5>', 'http://www.slate.com/success/barry-wilmore']",motion-media.theacademyofperformingartsandscience.org,79.1.14.87,"['george-nelson@twitter.com', 'http://facebook.com/info/anatoly-solovyev', 'www.www.slate.com']","{'os': 'osx', 'ram': 8589934592}",,,http://www.slate.com/warning/b-alvin-drew,[],/canhaz/james-mcdivitt.gif,200,this is a thing with lots of spaces wwwwoooooo,https://motion-media.theacademyofperformingartsandscience.org/canhaz/james-mcdivitt.gif,2015-05-18 12:28:25.013,"<script>console.log(\"xss\")</script>"
QuickSightに読み込ませたところ、問題なくグラフ化ができました。
QuickSightの認証を簡略化、Cognitoと連携させる
可視化まではとても簡単にできましたが、あくまでこれはQuickSightにアクセス時にサインアップしたアカウントで見ることになるので、実際の運用を考えると、Cognitoあたりと連携してくれないと運用が大変そうです。
ということで、Cognitoで連携できそうなこのOSSを利用します。
README.mdがきちんと書かれているので、その通りに実施すればひとまずは問題なさそうです。実際実施してみたところ、問題が特になくCognitoとQuickSightの連携をすることができました。
設定をしてログイン画面にアクセスするだけで上記の画面が表示されました。最初のサインアップは必要ですが、その後すぐにログインできるようになりました。
どうやらCognitoで連携する用のIAMロールが作成され、そのロールでログイン、アクセスができるようです。IAMのユーザ毎にロールが作成されるかと思いましたが、このOSSを利用した場合はIAMロールは共通のようです。この辺りは権限管理を考えたい場合は独自で実装などするしかなさそうですね。
まとめ
QuickSightは非常に簡単なBIツールでした。各種AWSサービスとも連携が簡単なので、サクッと大量ではないデータで何か分析結果を見せたい場合は便利そうですね。