こちらを読んで
データウェアハウスの実装手順について
データウェアハウス導入の基本戦略
ビジネスリスクを回避するために3つの戦略を採用すると良い
- 企業戦略
- 段階的デリバリ
- プロトタイピング
企業戦略
- 現在のアーキテクチャとツールを含む技術を選定する
- データの識別、粒度、マッピング、変換作業を適切に行う
段階的デリバリ
- 構築は、対象のサブジェクトに従って段階的に行う必要がある
- 予約データや請求データなどの関連事業のデータは、まずサブジェクト単位で構築してから、相互に統合する
- プロトタイピング
- 構築に対して大きくアプローチするのではなく、小さく開発とテストを繰り返す
具体的な実装手順
ステップ | タスク | 成果物 |
---|---|---|
1 | プロジェクトのスコープを定義する | スコープの定義書 |
2 | ビジネスニーズを特定する | 論理データモデル図 |
3 | データストアの要件を定義する | データストアモデル図 |
4 | ETLツールまたは開発によるデータ取得 | ツールまたは取得システム |
5 | データウェアハウスのデータ要件の定義 | 移行データモデル図 |
6 | 定義したデータ要件の見直し | Todoプロジェクトリスト |
7 | データウェアハウスにデータストアをマッピングする | データ統合マップ |
8 | データウェアハウス設計 | データウェアハウス設計図 |
9 | データストアからデータを抽出する | 統合された抽出したデータ |
10 | データウェアハウスへロードする | 初期データロード |
11 | データウェアハウスの保守 | 継続的なデータ抽出とロード |
データウェアハウス構築のベストプラクティス
- データの一貫性、正確性、整合性のテストプランを決定する
- 適切に統合、定義し、タイムスタンプを設定する
- 設計中は、ツール、ライフサイクル、データのコンフリクトに注意し、間違いを学ぶ準備をする
- 運用システムとレポートはリプレースしない
- データの抽出、クリーニング、ロードに時間をかけすぎない
- データウェアハウスを有用にしたいならビジネス担当者を含むすべての関係者をデータウェアハウスの導入プロセスに必ず関与させる
- エンドユーザー向けのトレーニングプランを準備する
書籍情報
クリシュナルンタ, データウェアハウジングを1日で学ぶ
https://amzn.to/2VNt4f0
Krishna Rungta, Learn Data Warehousing in 1 Day: Complete ETL guide for beginners
https://amzn.to/30THw92
雑感
翻訳が変な気がするので原書を読んだ方が良さそう