データウェアハウスに関する基本的な内容をまとめてみたものです。データウェアハウスに関する、Web上にすでにある解説コンテンツをまとめたサイトの抜粋です。
[ETL処理とは] (https://www.techcrowd.jp/bi/etl/)
[(Extract(抽出) Transform(変換) Load(書き出し))] (https://www.techcrowd.jp/bi/etl/)
ETLとは、BIで分析する時に重要となる
・Extract(抽出)
・Transform(変換)
・Load(書き出し)
の頭文字を並べたものです。
データを分析しやすい構造と内容に整理するために、BIではETL処理を行います。
さまざまなデータをETL処理する事で、利用しやすいものに変わります。
[データソースからデータを抽出、利用しやすい形に変換してDWHに格納する処理] (https://www.techcrowd.jp/bi/etl/)
各種データソースから抽出したデータを利用しやすいフォーマットに変換してから、DWHに格納するのがETL処理の基本的な役目です。
直接データーソースをDWHに入力したのでは分析しにくく処理効率が悪化するので、抽出・変換・書き出し処理をしてから、DWHで利用するのが一般的となっています。
どのような分析をするのかを明確にしてから分析する時に必要となる情報や項目を検討して、具体的なテーブル構成を決めてETL処理を行います。
[ETL処理が行えるソフトウェア] (https://www.techcrowd.jp/bi/etl/)
ETL処理が出来るソフトウェアには、
・オープンソースBIのPentaho
・OracleのWarehouse Builder
などがあります。
PentahoはETL処理以外にも、レポーティング・対話型分析・ダッシュボードなどにお機能を備えおり、Warehouse BuilderはOracleが持つ大規模データウェアハウス構築のノウハウを活かして、高品質で使いやすいETLツールとなっています。