1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

SPSS Modeler ノードリファレンス 2-2 レコード集計

Last updated at Posted at 2022-02-16

2-2 レコード集計ノード[レコード設定タブ]

107_89レコード集計.png

1.ノードの目的

データの集計を行います。

2.解説動画(60秒)

3.クイックスタート

Webログデータを対象にします。視聴者が閲覧した複数Webページが記録されるトランザクション形式です。*データは[5.参考情報]からダウンロードできます。

スクリーンショット 2022-01-21 15.05.27.png

[可変長ファイル]ノードに[レコード集計]ノードと[テーブル]ノードを順番に接続します。

スクリーンショット 2022-01-21 14.37.32.png

[レコード集計]ノードをダブルクリックして編集します。[キーフィールド]をブランクのまま[集計フィールド]を以下のように設定します。赤枠ボタンで集計するフィールドを選択し、統計量を確定します。
スクリーンショット 2022-01-21 14.50.49.png

[テーブル]ノードを実行します。このWebログデータの記録された期間と視聴時間の合計が計算されました。
スクリーンショット 2022-01-21 14.51.45.png

視聴者毎の集計を行います。[キーフィールド]に[顧客番号]を入れ、それ以外の設定は変更しません。
スクリーンショット 2022-01-21 14.58.14.png

[テーブル]ノードを実行します。Webサイトの1499名の視聴者の行動が要約されています。1視聴者1レコードで集計されRecord_Countはレコード数(視聴ページ数)を示しています。
スクリーンショット 2022-01-21 14.58.49.png

大規模データを利用する場合の注意点

中央値の計算は他の計算よりコンピュータリソースを使います。特別必要がなければ外してください。特に[データベース]を入力にしている場合には、中央値の演算でSQLプッシュバックが効かなくなり極端に処理速度が低下することがあります。

スクリーンショット 2022-01-21 15.08.27.png

4.Tips

大規模データでのレコード数の確認

スクリーンショット 2022-01-21 15.17.50.png

[プレビュー]を実行するとレコード数が表示されます。データが大規模な場合に素早くレコード数だけ確認するのに便利な方法です。

スクリーンショット 2022-01-21 15.19.53.png

大規模データでのキャッシュの利用

スクリーンショット 2022-01-21 17.30.13.png

レコード数が削減される[レコード集計]でキャッシュを利用すると都度大きな元データを読み込まずキャッシュを起点に処理するため、作業の効率化が期待できます。
スクリーンショット 2022-01-21 17.31.14.png

##5.参考情報

利用データ

右クリックでリンク先を保存してください。

ノードのヘルプ

SPSS Modeler 逆引きストリーム集(データ加工)

SPSS Modeler ノードリファレンス目次

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?