レコード数/ユニークなID数をカウントする(SPSS Modeler データ加工逆引き7-8)

Last updated at 2025-09-02Posted at 2022-08-16

レコード数/ユニークなID数をカウント（レコードカウント）

・読み込んだデータの概要確認

a.入力するデータは以下の通りです。[テーブル]ノードのヘッダーに[2フィールド,93レコード]と表示されるためこの時点でテーブル全体が93行だとわかります。

b.[レコード集計]ノードを何も設定しないでプレビューします。読み込んだデータの行数を最も早く知る方法です。SQLプッシュバックが有効の場合はSQLで集計済みの値のみを返すため高速処理が期待できます。

SQLプッシュバックは以下の記事で解説しています。

c.bと同じで何も設定していません。

d.[テーブル]を実行します。bと同じレコード数のみが表示されます。

e.[レコード集計]ノードを編集します。[キーフィールド]に[ID]を選択し、[フィールドにレコード度数を含める]からチェックを外します。

[プレビュー]します。IDをキーにしたのでIDのリストが表示されます。

f.[レコード集計]ノードを編集します。ひとつ前のテーブルのレコード数がIDの行数になるため[キーフィールド]をブランク、[フィールドにレコード度数を含める]にチェックを入れます。

g.[テーブル]ノードを実行します。

aで読み込むテーブルの規模が小さい場合には問題ありませんが、大規模な場合全レコードを表示するのに時間がかかり、Serverやクラウドにデータが存在する場合トラフィックに負荷がかかります。そのためレコード集計とサンプリングを効果的に利用してデータ理解を進めることをお勧めします。