LoginSignup
0
0

More than 1 year has passed since last update.

GCS上のTSVファイルからBQテーブルを作成する

Posted at

概要

Cloud ConsoleとCloud Shellを利用して、GCS上のTSVファイルをソースとしてBigQueryテーブルを作成します。

Cloud ConsoleはCSVファイルであればGCSインポートでテーブル作成できるのですが、TSVファイルには対応していないためCloud Shellでの転送処理が必要となります。

BQテーブルの作成

Cloud Consoleでスキーマを定義し、空のテーブルを作成します。

スキーマの定義

インポートするデータのスキーマを定義します。ここではテキストとして定義しています。

uid:STRING,gender:STRING,age:INTEGER

このテキストをテーブル作成画面のスキーマの項目で[テキストとして編集]のトグルをONにして、貼り付けます。
51f07ab1-e2f8-4261-9a51-43asdad8dc000e98.png

GCSから転送

GCSのTSVファイルをソースとして、前述の空のテーブルに対してデータを転送します。

bq load --source_format=CSV --encoding=UTF-8 --field_delimiter="\t" datasetName.tableName gs://bukectName/fileName.tsv

転送でエラーが発生した場合

スキーマの定義が誤っている場合などエラーが発生した場合には、スキーマと実際のデータを比較することになります。
ただファイル容量が大きい場合にはローカルで確認するのは不便なため、例えばCloud Dataprepでプレビューしながら確認すると良いと思います。

参考URL

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0