初めに
Talendの基礎を実践的に身に付けることが本記事の目的です。
環境
使用環境 | バージョン |
---|---|
OS | Windows10 |
Talend | 7.3.1 |
使用するコンポーネント
・tFileInputDelimited
・tLogRow
実践内容
Talendの一番基礎的な使い方であるファイルの読み込みと出力をしてみましょう。
実践
今回はこのcsvファイルを使用します。
コピペして使いましょう。
employee.csv
id,name,age
1,Ross,26
2,Rachel,24
3,Monica,24
4,Phoebe,25
5,Joey,25
6,Chandler,25
まずは「tFileInputDelimited」を配置して設定します。
「tFileInputDelimited」をダブルクリックし基本設定を設定します。
項目 | 設定内容 | 備考 |
---|---|---|
ファイル名 | csvファイルのパス | 入力フィールドの横の「…」からファイルのパスを指定。変数も使用可。 |
フィールド区切り | "," | 今回はcsvファイルなのでコンマを指定 |
ヘッダー | 1 | ヘッダーの行数を指定 |
※補足 | ||
詳細設定でエンコーディング等も設定できるので必要に応じて設定しましょう。 |
次に「スキーマの編集」の横の「…」からカラムの定義をします。
項目 | 設定内容 | 備考 |
---|---|---|
カラム | ヘッダー | カラム名を好きに入力しましょう。 |
タイプ | 型 | 値の型を定義します。 |
※補足 | ||
日付型を扱う場合は「パターン」で日付のパターン(yyyy-MM-dd)を設定してあげると良いでしょう。 | ||
「長さ」では最大桁数を指定できます。 | ||
「デフォルト」で各カラムのデフォルト値を設定できます。 |
次に「tLogRow」を配置し、「tFileInputDelimited」と繋げます。
「tFileInputDelimited」を右クリックし、「ロウ」、「メイン」と押下し「tLogRow」と繋げます。
最後に「tLogRow」の設定をしましょう。
項目 | 設定内容 | 備考 |
---|---|---|
スキーマ | 同期カラム | 同期カラムを押下すると繋いだコンポーネントに定義したカラムと同期します。 |
モード | テーブル | 値を出力するモードを選択できます。見やすいのを選びましょう。 |
実行
実行タブから実行しましょう。
読み込んだcsvファイルの内容が出力できました。
「tFileInputDelimited」で設定したヘッダー部分も確認できますね。
まとめ
Talendの「Hello World」的な、ファイルの入出力を実践しました。
実務ではまずファイルを正常に読み込めているか確認するためにこれらを行ったりするかもしれませんね。