はじめに
本記事では、PentahoETLの基本的なデータ変換処理の実装例および各処理を実装するにあたっての注意点などを紹介します。全5回に分けて紹介する内、本記事は第5回目です。その他の回は以下のリンクからご参照ください。
PentahoETLの基本処理パターン集【データ入力編】(1/5)
PentahoETLの基本処理パターン集【データ加工編1】(2/5)
PentahoETLの基本処理パターン集【データ加工編2】(3/5)
PentahoETLの基本処理パターン集【データ加工編3】(4/5)
注記
・本記事は、PentahoETLについての製品利用の必要知識を有する方を対象が対象です。
・本書内の画面などについて、Pentahoのバージョンによっては本書の内容と異なる可能性があることにご注意ください。
用語説明
PentahoETLで利用する機能の用語を紹介します。
# | 用語 | 処理単位 | 内容 |
---|---|---|---|
① | ジョブ Job |
実行処理単位 | 一つもしくは複数のTransformationをコーディネートするものです。スケジューリングされて実行されます。 |
② | データ変換 Transformation |
バッチ処理単位 | ソースデータをInputし、変換処理を実行してターゲットデータをOutputする最小単位です。 |
③ | ステップ Step |
処理の最小単位 | 事前に登録されている機能です。ステップのプロパティに具体的な値を入れることで要求する処理が実行されます。 |
基本処理パターン例の見方
処理パターンリスト
# | 処理 | 使用ステップ |
---|---|---|
1 | CSVファイル出力 1. 単一ファイル書き出し 2. 複数ファイル書き出し |
・テキストファイル出力 |
2 | Excelファイル出力 1. 新規ファイル書き出し 2. テンプレートから生成したファイルへの書き出し |
・Microsoft Excel Writer |
3 | DBテーブル INSERT | ・テーブル出力 |
4 | DBテーブル UPDATE | ・更新 |
5 | DBテーブル UPSERT | ・挿入/更新 |
6 | XMLファイル出力 | ・XML Output |
7 | JSONファイル出力 | ・JSON Output |
パターン紹介
1-1. CSVファイル出力 単一ファイル書き出し
1-2. CSVファイル出力 複数ファイル書き出し
2-1. Excelファイル出力 新規ファイル書き出し
2-2. Excelファイル出力 テンプレートから生成したファイルへの書き出し
3. DBテーブル INSERT
4. DBテーブル UPDATE
5. DBテーブル UPSERT
6. XMLファイル出力
7. JSONファイル入力
まとめ
今回はPentahoETLの基本処理パターン データ出力編を紹介しました。
基本処理パターンは他の記事でも紹介しておりますので、ぜひご参照ください。
他社商品名、商標等の引用に関する表示
HITACHIは,株式会社 日立製作所の商標または登録商標です。
Excel、MicrosoftおよびWindowsは、マイクロソフト 企業グループの商標です。
Pentahoは、Hitachi Vantara LLCの商標または登録商標です。
その他記載の会社名,製品名などは,それぞれの会社の商標もしくは登録商標です。