1. はじめに
IBM Cloud Pak for Data as a Service(CP4DaaS)のSPSS Modelerフローをデプロイメント・スペースにプロモートしバッチジョブを作成する方法について記載します。
SPSS Modelerフローをデプロイメント・スペースにプロモートする場合、これまではプロジェクトをエクスポートしてからデプロイメント・スペースにインポートする必要がありました。
2024年11月19日の新機能により、SPSS Modelerフローをプロジェクトからデプロイメント・スペースに直接プロモートできるようになりました。
また2024年9月10日の新機能により、デプロイメント・スペースでSPSS Modelerフローのバッチジョブを作成できるようになりました。
この記事では上記の新機能を使用してSPSS Modelerフローをデプロイメント・スペースにプロモートしバッチジョブを作成・実行するまでの手順を記載します。
(2024年12月時点の機能をもとに記載していますが、今後UIや仕様に変更が入る可能性がある点をご了承ください。)
2. SPSS Modelerフローの作成
まず以下のようなシンプルなSPSS Modelerフロー(spss_modeler_flow)を作成します。
このフローではデータ資産ノードでCSVファイル(input.csv)をインポートし、フィルター・ノードでヘッダー名を変更した後、データ資産エクスポート・ノードでCSVファイル(output.csv)をエクスポートしています。
フローを1度実行し、output.csvを出力しておきます。
参考までに上記のファイルはこちらからダウンロードできます。
3. デプロイメント・スペースへのプロモート
次にSPSS ModelerフローとCSVファイルをデプロイメント・スペースへプロモートします。
(事前にデプロイメント・スペースを作成しておきます。)
プロジェクトをエクスポートしてデプロイメント・スペースにインポートする従来の方法も可能ですが、ここではSPSS ModelerフローとCSVファイルをデプロイメント・スペースへ直接プロモートします。
まずSPSS Modelerフローのオーバーフロー・メニューをクリックし、「スペースへのプロモート」を選択します。
プロモート先のデプロイメント・スペースを選択し、「プロモート」をクリックします。
プロモートが成功したら、メッセージ内の「デプロイメント・スペース」のリンクをクリックして、デプロイメント・スペースを表示します。
プロモートしたSPSS Modelerフローが資産の一覧に表示されています。
入力ファイルと出力ファイルのCSVファイルも同様の手順でプロモートします。
4. バッチジョブの作成と実行
次にデプロイメント・スペース上でSPSS Modelerフローのバッチジョブを作成します。
プロモートしたSPSS Modelerフローのオプションをクリックし、「新規ジョブ」を選択します。
フロー・パラメーターは使用していないため、そのまま「次へ」をクリックします。
複数のターミナル・ノードがある場合に実行するノードを選択できますが、ここでは1つだけのため、そのまま「次へ」をクリックします。
「ジョブ作成後に実行」にチェックを入れ、「次へ」をクリックします。
SPSS Modelerフローで指定した入力ファイル(input.csv)と出力ファイル(output.csv)のマッピングが自動的に行われるため、状況が「成功」となっています。そのまま「次へ」をクリックします。
最後に設定した内容を確認し、「作成して実行」をクリックします。
成功すると以下のダイアログが表示されるので「閉じる」をクリックします。
ジョブが完了したらデプロイメント・スペースの資産から、ジョブの実行により出力ファイルが更新されていることを確認します。
手順は以上になります。
参考:watsonx.ai Studioのプロジェクト内でのジョブ作成
watsonx.ai Studioのプロジェクト内でSPSS Modelerフローのジョブを作成することもできます。(SPSS Modelerフローのオーバーフロー・メニューをクリックし、「新規ジョブ」を選択します。)
デプロイメント・スペースのジョブとほぼ同様の形式でジョブを作成可能ですが、プロジェクト独自のオプションとして、ジョブを新規フローとして保存するかどうかを選択する設定がジョブ作成の最初の画面にあります。この設定を試してみた結果を以下に記載します。
「新規フローとして保存」を選択し、ジョブを作成しスケジュール実行します。ここでは3回実行しています。
プロジェクトの資産一覧を確認します。
「spss_modeler_flow」がジョブでスケジュール実行したフローですが、ジョブが実行される度にSPSS Modelerフロー名の末尾に連番が付く(「spss_modeler_flow_1」、「spss_modeler_flow_2」のような)形で別名保存されていることが分かります。
おことわり
このサイトの掲載内容は私自身の見解であり、必ずしも所属会社の立場、戦略、意見を代表するものではありません。 記事は執筆時点の情報を元に書いているため、必ずしも最新情報であるとはかぎりません。 記事の内容の正確性には責任を負いません。自己責任で実行してください。