Impala
Parquet

Parquet形式のデータをSQL一発で作成する

分析基盤を作るにあたり、ストレージ・ファイルフォーマット選定は非常に重要な項目である。
Parquetは、高い圧縮率と高速な分析を可能にするファイルフォーマットである。
既存の非Parquet形式のテーブルから、Parquet形式にデータ変換するには、CREATE TABLE AS SELECT(CTAS)を実行すればいい。

実行例

CREATE TABLE tbl_pq STORED AS PARQUET AS SELECT * FROM tbl;

注意

テーブル作成後は COMPUTE STATS <テーブル名> の実行を忘れずに。

参考