DBにSQLを自動発行させ処理速度を上げる(SQLプッシュバック)
1.想定される利用目的
・大規模なデータベースを入力にした際のデータ加工速度の向上
2.サンプルストリームのダウンロード
ストリームは逆引き9-6と同じものです。DB入力ノードは個別に設定ください。
3.サンプルストリームの説明
a.入力するデータのひとつ目です。6種類のカテゴリーと値が100万レコード(行)生成されます。

DB接続は以下の記事を参考にしてください。
c.[レコード結合]ノードを編集します。ふたつの入力データを[Cate]をキーに内部結合します。

d.[フィールド作成]ノードを編集します。値に重みを掛けます。

f.[テーブル]を実行します。プロセスがSQLに変換されるとノードが紫色に発光します。

1秒かからず、処理が完了してテーブルが表示されます。実際にDBが処理したSQLもわかります。

同じ処理をメモリ16GBのMacで行うと28秒かかりました。

注意事項
自動でDBに投げられたSQLを表示するにはあらかじめストリームのプロパティの設定が必要です。
実行前にどのノード範囲までSQLプッシュバックが効くやSQL文を確認する場合は以下の赤枠ボタンを押します。

4.参考情報
SQLプッシュバックを解説した記事
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)




