More than 5 years have passed since last update.

bigqueryから抽出したビッグデータを、csvでダウンロードするの面倒じゃない？

Posted at 2020-09-06

bigqueryでは、抽出したデータをcsvダウンロードすることができるが、
16,000行以上ある場合、一度、ストレージに格納してからダウンロードする必要がある。

今回は、それらを自動化する方法をクラウドシェルで実現・実装する。

個人メモ
※自動化ポイント１：テーブル名を指定する
※自動化ポイント２：ストレージのパスを指定する
※自動化ポイント３：csvのファイル名を指定する
※自動化ポイント４：utf8からsjisへの文字コード変換
※クラウドシェルは無料だよ！

# 変数 --------------------------------------------------------
DATASET="sample_dataset" # BigQueryのデータセットを指定
BUCKET="gs://sample_bucket/sample_folder" # ストレージバケットを指定
TODAY=`date "+%Y%m%d_%H%M%S"`
OUTPUT=${HOME}"/output" # ホームディレクトリのフォルダを指定

# 処理 --------------------------------------------------------
# テーブルリストを表示
echo テーブルリストは、下記です。
bq ls $DATASET |awk '{print $1}'
# 入力
# ※ここでテーブルを指定します。
echo -n ダウンロードするテーブル名を入力してください。:  
read INP
FILE=${INP}_${TODAY}
# GCSにエクスポート
bq extract ${DATASET}.${INP} ${BUCKET}/${FILE}
# VMにコピー
gsutil cp ${BUCKET}/${FILE} ${OUTPUT}/${FILE}
# UTF8からsjisに文字コード変換
iconv -f UTF8 -t SJIS ${OUTPUT}/${FILE} > ${OUTPUT}/${FILE}.csv
# ローカルPCへダウンロード
cloudshell dl ${OUTPUT}/${FILE}.csv

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up