Impala

1行あたりの最大サイズを変更する

More than 1 year has passed since last update.

Impalaの行サイズはデフォルトで512KBに制限されている。殆どの場合問題にならないサイズだが、複数テーブルのJOINなどにより大量のカラムが生成された場合、この制限にひっかかり、以下のようなエラーが出る場合がある。

Row of size 698.78 KB could not be materialized in plan node with id 1. 
Increase the max_row_size query option (currently 512.00 KB) to process larger rows.

その場合、 MAX_ROW_SIZE クエリオプションを指定することで行サイズを拡張することができる。

実行例

SET MAX_ROW_SIZE=1mb;
CREATE TABLE table_pq STORED AS PARQUET SELECT * FROM table_orig WHERE col1 = 'hoge';

注意

そもそも1行あたりのデータが小さい方が好ましいので、この制限に引っかかるようであれば、オプションの変更よりまず行サイズの削減が可能かどうかを検討した方がいいだろう。

参考