1
0

More than 1 year has passed since last update.

非エンジニアがCData Sync で複数のCSV ファイルをSnowflake にレプリケートしてみた。

Last updated at Posted at 2022-12-18

はじめに

こんにちは、CData Software Japan でOperations Manager をやっている佐藤です。この記事は、Qiita CData Software Advent Calendar 2022 18日目の記事になります。

今回はCData Sync を使って手許(ローカルドライブ)にある複数のCSV ファイルをSnowflakeへレプリケーションしてみました。

CData Syncについて

CData Sync を使用するとkintone、Salesforce をはじめとしたSaaS、各種アプリケーションのデータを単一のDB やDWH へノーコードで集約できます。

普段は経理をはじめとした事務仕事をしている私ですが、本当にノーコードでデータを単一DBへ集約できるのでしょうか??

CData Sync のインストール

CData Sync のインストールについてはこちらの記事をご参照ください。
https://qiita.com/kuwazzy/items/30e501a0ac4f60a9178d

もろもろの設定

データソースとなるCSV ファイルの準備

まずはおもむろにExcelを開き、練習用の特に意味の無いファイル複数個を作成します。

image.png
.csvで保存。しかし、本当に意味が無い・・・。

Snowflake 側

Snowflake側にDBを準備します。

image.png

Data → Database → 右上の +Database というところを押すと新しいDBが作れます。
必須項目はDBの名前だけですね。今回は「Sync」としておきました。

Sync側

接続先にSnowflake を追加
image.png
接続 → 同期先 → Snowflake で追加。

image.png

項目
名前 今回は「Snowflake」としました
プロバイダークラス デフォルト(変更不可)
Auth Scheme Password
URL Web画面にログインするときのURL
Password Web画面にログインするときのPW
Waregouse COMPUTE_WH
Schema PUBLIC

次はデータソースとしてCSVを追加

image.png
URIには先ほど作成した意味の無いCSVファイルが格納されているフォルダを指定

最後にジョブを作成。データソースにCSVを指定し、同期先にSnowflakeをそれぞれ指定
image.png

特にプロパティはいじらずタスクを作成し実行してみる。
image.png
これが出てくれば成功!(最初csvファイルをExcelで開いていたらエラーになった。編集中だとダメみたいです。)

Snowflake側でDBを見てみる。
image.png
先ほどの特に意味のないcsvがレプリケートされています。

まとめ

普段は事務仕事の経理のおじさんでも、CData SyncとSnowflakeを使用して、複数のCSVファイルを1つのDBにまとめることが出来ました!
今回は特に意味のないCSVファイルを特に意味も無くDBへ集約するという、無駄に洗練された無駄の無い無駄なデータ連携になってしまいましたが、様々な業務システムから出力されるcsvファイルをひとつのDBに集約することが出来たら日常のレポーティングに役立てたり、経営判断に役立つ分析が容易になりそうです。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0