追加で保存したデータの最新版を使う。

Last updated at 2024-08-17Posted at 2024-08-17

はじめに

Domoを使い始めて、二ヶ月目。データをいろいろ集めてはいますが、日々、精進しております。

今回は、とあるK○t○neのデータを毎日最新版として取り込んでいますが、今後、変更箇所を見ていくこともあると思い、
取り込んだデータの履歴を全て取り込んでいます。

ですが、使うのは最新のデータだけ！

最新のデータだけ使えるようにするETLを紹介します。

対象者

ETL初心者

使ったデータ

今回、使ったデータは、こんな感じです。追加なので、これを数回取り込んで使ってみました。

データを追加で取り込むとは？

そもそもデータを追加で取り込むというのは、どういうことか！？

Domoには、データを取り込むときのバターンとして、「置き換え」と「追加」というモードがあリます。
「置き換え」とは、今入っているデータを全て削除して、データを置き換えます。
そのため、前のデータは無くなります。
それに対して「追加」は、前のデータは残しながら、データを追加で保存しておきます。

その設定は、DataSetを作るときに、アップデートモードというものがあり、
更新方法を、「追加」にすると、そのような動きになります。

データの追加の時のデータ構造

追加で保存されると、データが混ざってしまわないか、心配になりますよね。
そこはご心配なく！

追加でデータを取り込んだときには、【_BATCH_ID_】、【_BATCH_LAST_RUN_】の列が自動的に追加されます。

【_BATCH_ID_】には、取り込んだ時のグループ番号が入ります。初めて取り込んだら１、そこから取り込むたびに＋１された数値が入ります。
【_BATCH_LAST_RUN_】には、取り込んだ時の時間が入ります。タイムスタンプ型なので秒まで格納されますが、取り込む時間がすごく掛かっても、同じグループ番号の時間は同じものが入るようです。