Talend Open StudioといオープンソースのELTツールがある。
※ELT(データの抽出・加工・ロード)
半年に一回ジョブを作る程度なのに、日本語の情報がほとんどなくて、毎回忘れるので自分用にメモ。
##talend開きかた
①talendを起動してプロジェクトを開く。新規プロジェクトを作成してもよい。
※プロジェクトの中にジョブがあり、ジョブ単位で処理を記述できる構成になっている。
##使用したいウィンドウがないとき
メニューの「ウィンドウ」→「ビューの表示」
あとは閉じていたりするので、いろいろ開いたり閉じたり試してみる。
##ジョブの作り方
①Repositoryウィンドウのジョブ右クリック→ジョブの作成
②Nameを入力して終了
③RepositoryウィンドウのメタデータのDB接続(作成は後述)から、テーブルをドラッグ&ドロップして入力元と出力先作成する。
今回は、SQLサーバからmysqlへデータをコピーしたいので、入力元はtMSSqlInput、出力先tMysqlInputにした。
④データコピーの際にカラムのマッピングがしたいので、ジョブの右上の左三角をクリックしてパレットを開き、検索窓にtmpapと入力してtmpapを検索して、ドラッグ&ドロップする。
お忘れPOINT:tmpapの場所はジョブの右上の三角開いたとこにあるよ!
⑤入力元オブジェクトを右クリックして、rowのmainを選択してtmapへ。tmapをを右クリックして、rowのmainを選択して出力先へ。入力元→tmpa→出力先と矢印をつなぐ。
⑥tmpaをダブルクリックして設定画面を開き、左から右へ対応するカラムをドラッグ&ドロップして対応付けを行う。
⑦コンポーネントをダブルクリックして、ジョブの設定を行う。
出力先をクリックして、基本設定タブのデータ操作を挿入であったり、更新に変更する。
⑧ジョブを右クリックして、ジョブの実行をクリックするとジョブが実行される。
⑨ジョブを右クリックして「ジョブのエクスポート」を選択すると、コンソール実行できるshellとexeが取得できる。これをcronで実行してやる。
##メタデータへテーブルを追加したい。カラムの変更などをメタデータで再読み込みしたい。
①メタデータのDB接続で各DBを右クリックして、「スキーマのリトリーブ」を選択
②「フィルタを選択画面」は次へ
③追加や更新したいテーブルを選択して次へ
④終了ボタン
##メタデータの新規作成
①メタデータのDB接続を右クリックで「create connection」を選択
②Nameを入れて次へ
③DBType、ログイン、パスワード、サーバ、ポート、DataBaseを入力。接続できるかcheckで確認。接続できれば終了。
##ジョブの設定をしたい。
①ジョブを開きコンポーネントをダブルクリック。
②基本設定タブ、詳細設定タブなどで設定を変更できる。
##参考URL
使えそうなリンクメモ。