0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

GoogleCloudStorageからTreasureDataへのデータインポート

Posted at

概要

会社でTreasureDataをデータレイクとして使っているのでGoogleCloudStorage(以降GCS)からのデータインポートを試してみます。
前回(BQからのインポート)の続きとなります。

ドキュメントを参考に用意されたデータコネクタを利用します。

準備

TreasureDataのコネクタ設定の準備として、必要なものは以下
(こちらも前回と同様ですね。)

  • BigQueryのJSON keyfile
  • BigQueryのプロジェクトID

GCSにインポート対象のファイルを用意

テスト用に出力したCSVファイルをおいておきます。

スクリーンショット 2019-11-25 11.33.33.png

サービスアカウントキーを作成

前回と同じなので省略します。

TreasureDataでのコネクタ設定

カタログからGCSを選択します。
スクリーンショット 2019-11-25 11.37.29.png

スクリーンショット 2019-11-25 11.38.23.png

まずはJSON keyfileの入力が求められますね。
入力してContinueを押すと、認証情報が作成されます。

スクリーンショット 2019-11-25 11.41.37.png

続いて「New Source」よりコネクタを作成します。
バケットとプレフィックスを入れて次へ

スクリーンショット 2019-11-25 11.47.04.png

読み込めていれば、プレビューで確認できます。
スクリーンショット 2019-11-25 11.48.16.png

以降は、他のコネクタと同様の項目ですね。
まずはインポート先の情報設定です。
今回もテスト用に新規で作ります。

スクリーンショット 2019-11-25 11.50.02.png

続いてスケジュール設定ですが、今回は設定なしでいきます。
スクリーンショット 2019-11-25 11.50.37.png

最後にコネクタの名前をつけて実行!
実行ログを眺めて完了を待ちます。
スクリーンショット 2019-11-25 11.50.53.png

ファイルサイズがそれなりにあるので多少時間(450MBで4分ぐらい)かかりましたが、問題なく取り込めているようです。

スクリーンショット 2019-11-25 11.57.12.png

お片付け

恒例のお片付けをしておきます。

TreasureData側

  • 作成したテーブル
  • BQ用のコネクタ
  • BQ用の認証情報

GCS側

  • GCSにアップしたファイル
  • テスト用のサービスアカウント
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?