Amazon Athenaを使ってみた

Last updated at 2016-11-30Posted at 2016-11-30

AWS re:Invent 2016のキーノートにてAmazon Athenaが公開されたので、使ってみました。

Amazon Athenaとは

公式ページに詳しく載っていますが、簡単に言うとS3を標準SQLでクエリ可能にしたサービスです。

早速使ってみる

AWSコンソールログイン後のサービス一覧にはまだ追加されていませんでしたが、公式ページから使ってみます。

検索する

サービスに入るとsampledbがすでにセットされているので、まずは検索をかけてみます。

ログイン後の画面は完全にSQL管理画面ですね。

すでにsampledbの中にelb_logsというテーブルがあるので、検索をかけてみます。

select * from elb_logs;

すぐ結果が返ってきました。素敵。

ちなみにここまででS3にアクセスしてみたら、新しいバケットができていました。

ほかにもいくつか試してみます。全部で何件あるのか確認。

select count(*) from elb_logs;

backendprocessigntimeが0.2より大きいものを検索。

select * from elb_logs where backendprocessingtime > 0.2;

カウント数は165件でしたので、無事絞り込めているようです。ちなみにデフォルトの最初の表示件数は99件のようです。スクロールすればもちろん動的に更新されていきますが。

テーブルを作成してみる

せっかくなので新しくテーブルを作成したいと思います。適当なcsvファイルが必要なようなので、以下のようなデータをS3に登録しておきます。

id, name, age, position
1, Yamada, 22, Member
2, Taro, 30, Project Leader
3, Sato, 27, Sub Leader
4, Ichiro, 46, Manager

DB、テーブルの作成

最初にデータベース名とテーブル名、S3のパスを書きます。説明が書いてあるのでS3のパスもどのようにかけばいいのか明確で使いやすいです。ちなみにすでにあるデータベースを使うこともできますし、新しい名前を書けば勝手に新しいデータベースを作成してくれます、これも素敵。
（DDLを見てみると「CREATE EXTERNAL TABLE IF NOT EXIST」となっていたので、仮にテーブルの重複作成をしようとしても防いでくれるようです。どういう動作をするのかまでは知りません。）