##全体の目的
Talendの超簡単なサンプルジョブを作成して,ETLジョブ開発に必要なスキルを習得することが目的です。
##対象者
ETL / EAI技術者
##環境
使用環境 | バージョン |
---|---|
OS | Windows10 |
Talend | 7.1.1 |
##サンプル一覧
以下の順番で習得していきます
# | 内容 |
---|---|
1 | はじめてのTalend |
2 | ファイルI/O |
3 | データベースI/O |
4 | tMap |
5 | イテレータ |
6 | メタデータ |
7 | Context変数 |
8 | Global Map |
9 | tHashInput/tHashOutput(今回) |
10 | エラーハンドリング |
11 | ロギング |
12 | 子ジョブ(ジョブのネスト) |
13-1 | 設定ファイル読み込みオリジナル版 |
13-2 | 設定ファイル読み込みコンポ版 |
14 | tJava |
##今回の目的
tHashInput/tHashOutputについて理解する。
##tHashInput/tHashOutputとは
ロウをメモリに保持しておけるコンポーネントです。
何度も同じマスタをlookupする場合など、**「データベースI/OやディスクI/Oを一度で済ませロウを使いまわす」**といった設計の場合に力を発揮します。
- tHashOutput
- ロウをメモリに保持する際に使います
- tHashInput
- メモリに保存済みのロウを取得する際に使います
##サンプル作成
サンプルプログラムを動かしながら使い方を見ていきましょう。
以下サンプルを作成します。
- CSVファイルをロード
- tHashOutputを使いメモリにロウを保持
- メモリに保持しているロウをtHashInputで取得
- ログを出力
入力ソース準備
in.csvというファイルを作成します。
今回は C:\work\hashinput\in.csv に作成しました。
- エンコードはシフトJIS
- 改行コードはLF
id,name,gender
1,kouda,男
2,mori,男
3,kubo,男
4,shimizu,男
5,aya,女
###ジョブの作成
リポジトリの[ジョブ]を右クリックし[ジョブの作成]を選択します。
[名前]にhashinputと入力し[Finish]ボタンをクリックします。
###tHashOutputとtHashInputを使えるようにする
デフォルト設定ではtHashInputとtHashOutputが使えません。
PaletteFilterボタンをクリックします。
パレットの設定画面で Hide - テクニカルの中にtHashInputとtHashOutputがあることを確認します。
確認できたら右矢印をクリックします。
Show側に登録できたらOKボタンをクリックします。これでパレットから呼びだすことができるようになります。
###tHashOutputとtHashInputの配置
[tFileInputDelimited]と[tHashOutput]を配置しロウでつなぎます。
[tFileInputDelimited]の[基本設定]を以下のように設定します。
項目名 | 設定内容 | 説明 |
---|---|---|
ファイル名 | C:/work/hashinput/in.csv | 読み込みファイルのパス |
フィールド区切り | , | 入力データに合わせてカンマを指定 |
ヘッダー | 1 | 1行目はヘッダとして扱う |
[tFileInputDelimited]の[詳細設定]でエンコーディングを指定します。
項目名 | 設定内容 | 説明 |
---|---|---|
エンコーディング | CUSTOMでSJIS | 入力ファイルのエンコーディングに合わせる |
スキーマ編集ダイアログを開きカラム名とタイプを以下のように設定します。
列 | カラム | タイプ |
---|---|---|
1列目 | id | int |
2列目 | name | String |
3列目 | gender | String |
[tHashInput]と[tLogRow]を配置しロウでつなぎます。
さらに[tFileInputDelimited]で右クリックしサブジョブOKで[tHashInput]につなぎます。
ここで一度実行してみましょう。
何も出力されません。。。でもこれで準備はできました。次に進みましょう。
###tHashOutputとtHashInputのひもづけ
[tHashOutput]の[基本設定]を開きスキーマの編集ボタンをクリックします。
[tHashInput]の[基本設定]を開きスキーマの編集ボタンをクリックします。
インポートボタンをクリックし、先ほど保存したスキーマ定義.xmlを指定します。
それでは再度実行してみましょう。
メモリに保持しているロウ(tHashInput)の内容を出力できました。
##まとめ
今回はtHashInputとtHashOutputコンポーネントの使い方を紹介しました。
メモリリソースに余裕があればロウの使いまわしができるこのコンポーネントは使いどころが多いのでぜひ試してみてください。
あらたに利用したコンポーネントと用途をおさらいしておきます。
- tHashOutput
- ロウをメモリに保持
- tHashInput
- メモリに保存済みのロウを取得
毎度のことですが、ほんのさわりの部分だけを解説していますのでぜひここから深掘りしてみてください。
##次回以降
次回はエラー処理をやっていきます。