Talendとは?(簡単に)
オープンソースの統合ソフトウェア
今回利用するのはその中の「Data Integration」というETLツール
有償版と無償版(Talend Open Studio)があるが、
無償版でやりたいことはほとんど出来るのでそっちを利用する。
※チーム開発をしたいなどあれば有償版がいいそうな(詳細は知らない)
他にも様々なツールがあるので興味あれば「TalendHP > ダウンロード」を見てください。
なにができるの?
とりあえず色々出来る。今回私が使用した機能を例に挙げると
・FTPにあるファイルのDownload/Upload
・Amazon S3にあるファイルのDownLoad/Upload
・マスタ用ExcelとDownLoadしたCSVなどのマッピング
・CSVやExcel出力
・エラー時にメール送信
などなど。
当然DBにつないだり、AWS以外のクラウドサービスにつないだりも可能。
日本語マニュアルもあるので、興味あればそちらを確認(1500ページ位あるので心が折れないよう注意)
※PDFなので「Talend Integration Suite コンポーネント リファレンスガイド」とかで検索
初期設定
用意するもの
・JDK8
以下OracleのJDKDLページより
「Java SE Development Kit 8u171」の「◯Accept License Agreement 」にチェック
自分の環境に合わせたやつをダウンロード
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
ダウンロードされた実行ファイル(渡しの場合はjdk-8u171-windows-x64.exe)を実行し、好きな場所にインストール。
・Talend Open Studio for Data Integration(v7)
以下Talend公式HPの「ダウンロード」をクリックし、保存
https://jp.talend.com/products/data-integration/data-integration-open-studio/
ダウンロードされたZIPファイルを、好きな場所に解凍
フォルダ内の「TOS_DI-win-x86_64.exe」を実行するとTalendが立ち上がる。
プロジェクトの作成
新規プロジェクトを作成 > 完了
で画面が起動する。
※Talendのインストールディレクトリの「workspace」フォルダにプロジェクトが作成される
初期設定は以上です。
次回は簡単な使い方を説明できればと思います。