DBキャッシュで処理速度を上げる
1.想定される利用目的
・大規模なデータベースを入力にした際のデータ加工速度の向上
2.サンプルストリームのダウンロード
ストリームは逆引き9-5と同じものです。DB入力ノードは個別に設定ください。
この記事は逆引き9-5と9-6を組み合わせた利用方法です。そちらを先に参照ください。
3.サンプルストリームの説明
a.入力するデータのひとつ目です。6種類のカテゴリーと値が100万レコード(行)生成されます。

DB接続は以下の記事を参考にしてください。
c.[レコード結合]ノードを編集します。ふたつの入力データを[Cate]をキーに内部結合します。

d.[フィールド作成]ノードを編集します。値に重みを掛けます。

[レコード集計]ノード上で右クリックし[キャッシュ]>[使用する]を選択します。

f.[テーブル]を実行します。バッジが四角からDBマークに切り替わり緑に点灯しました。入力で利用した2つのテーブルを結合・加工した上でDB内に1時的なテーブルを作成(DBキャッシュ)したことを意味します。後続の処理はレコード集計を基点にするだけでなくSQLプッシュバックが有効になります。

注意事項
DB内に一時的なテーブルを作らせたくない場合にはストリームのプロパティの設定で以下をオフにします。

4.参考情報
DBキャッシュを解説した記事
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)




