- spoon は Excel、csv、各種DB などのデータソースの読み込み、http リクエスト、httpレスポンス(json)に対して処理が出来る ETL ツールです。
- GUI でパーツを組み合わせてETL処理を組み立てます。
(SQL、java、javascript などのコードを書くことも出来ます。)
- そのまま使っても良いですが、業務などで使う場合環境設定をする事で更に便利に扱えるので環境設定方法についてまとめています。
記事内で使用する環境 | ダウンロード先 |
---|---|
pdi-ce-9.3.0.0-428 |
https://sourceforge.net/projects/pentaho/files/Pentaho-9.3/client-tools/ ・pdi-ce-9.3.0.0-428.zip |
openjdk version "11.0.2" 2019-01-15 |
https://jdk.java.net/archive/ ・11.0.2 |
環境準備
起動
- 環境変数の JAVA_HOME に java ディレクトリが設定されていれば、
data-integration\Spoon.bat を実行するだけで spoon が起動します。 - 今回は KETTLE_HOME を設定して、本番環境・検証環境ごとにプロパティを分離して起動します。
-
C:\PDI
に下記の .bat を作成して起動します。preSpoon.batcd /D %~dp0 SET KETTLE_HOME=C:\PDI\config\PRE SET JAVA_HOME=C:\java\jdk-11.0.2 data-integration\Spoon.bat
proSpoon.batcd /D %~dp0 SET KETTLE_HOME=C:\PDI\config\PRO SET JAVA_HOME=C:\java\jdk-11.0.2 data-integration\Spoon.bat
プロパティの設定
-
spoon が開いたら
Ctrl + Alt + P
でkettle.properties
を開きます。(または「編集」→「kettle.propertiesファイル編集」)
-
kettle プロパティに接続環境の情報を入力します。(PW は後ほど設定します。)
下記は例として postgreSQL のプロパティを設定。
事前に postgreSQL で spoonPre DB を作成済み。
-
「ジョブ」→「データベース接続」の順に選択する。
その他設定
便利だと感じた設定をまとめています。