AWS re:Invent 2016にて、Amazon Athenaという、S3にストアされたデータに対してSQLを投げられるサービスが発表されました。
AWS Blogを読む限り、色々とGoogle BigQuery
に似ています。
すでにUS East (Northern Virginia), US West (Oregon)リージョンで利用可能となっています。
BigQueryとの比較
ブログやFAQから得られる情報によれば、AthenaのSpecは、BigQueryと比較して以下のようになっています。
Athena | BigQuery | |
---|---|---|
クエリエンジン | Presto | Dremel |
ストレージ | S3 | Colossus |
SQL | ANSI SQL(バージョンは?) | SQL2011(Standard SQLの場合) |
UDF | × | Javascript, SQL |
JDBC | ○ | × |
Web UI | ○ | ○ |
Web UIはこんな感じです
サンプルとしてelb_logs
というテーブルが初めから入っています。
料金
Athenaではクエリに対してのみ課金が行われるようです。(とはいえ、ストレージがS3なのでその分のコストは別途かかります)
$5 per TB of data scanned.
とのことで、料金体系もBigQueryと同様です。
ただし、Athenaでは、SELECTする列を絞ってスキャン容量を削減するためには、自前で列指向フォーマットでS3に置いておく必要があるようです。
今の所、BigQueryのBilling Tier的なものは見当たらず、純粋にスキャンした容量によって料金が決まるようです。
感想
- JDBCに対応しているのは嬉しい
- 大きなデータセットで試してみたい
- BigQuery並みの超性能が出るならかなり期待できそうな気がします