embulk で BQ in BQ out で Partitioned tables に躓いた

More than 1 year has passed since last update.


Embulk で BigQuery -> BigQuery がやりたい。
out側のテーブルは Partitioned tables としたい(DATE型またはTIMESTAMP型のカラムを指定)


を用いて、実行したが、どうも Partitioned tables だとうまく動かない。

あらかじめ out側の BigQuery で以下のようなものを実行して Partitioned tables を作成しておく。

CREATE TABLE mydataset.newtable (transaction_id INT64, transaction_date DATE)
PARTITION BY TIMESTAMP(transaction_date)

in側で TIMESTAMP型のカラムを作り、out側に流してみたものの Partition 絡みでエラーがでてしまい実行できなかった。
おそらく embulk-output-bigquery が Partitioned tables に対応しないとダメそう。
Tables partitioned by ingestion time の方には対応しているので、今回はそちらで対応することにした。
もちろん前の記事のように Cloud Dataflow など使えば問題なくできる。

