勉強前イメージ
DBってイメージ
調査
ETL とは
Extract(抽出),Transform(変換),Load(書き出し)の頭文字を取ったもので
膨大なデータを分析しやすい形にする処理、それを支援するソフトウェアがETLになります。
主にBIツールのために作成されるデータウェアハウス(DWH)を構築するときに
発生するプロセスとして用いられています。
- 抽出
基幹システムやデータベースからデータの抽出を行います。
- 変換
DWHに書き出しやすいようにデータの変換を行います。
- 書き出し
変換のプロセスを踏んだデータをDWHに書き出します。
ETLの特徴
- 大量のデータの変換・加工が得意
- 高速での処理が可能
- メタデータの管理が可能
ETLのメリット
- 開発工数の削減
ツールはデータの統合に必要な部品を提供しており、
組み合わせてデータ統合のプログラムができます。
組わせるのも直感的に操作できます。
- データ品質の向上
データのフォーマットが点在していても適切なデータ形式に変換されます。
またデータの重複や誤りを自動修正するので、初心者でも室の高いデータ統合ができます。
勉強後イメージ
聞いたことあったけど実際よく知らなかった....
DBじゃなくてDBのデータを加工したりすることなのね。