0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

レコード数/ユニークなID数をカウントする(SPSS Modeler データ加工逆引き7-8)

Last updated at Posted at 2022-08-16

レコード数/ユニークなID数をカウント(レコードカウント)

スクリーンショット 2022-08-03 10.31.31.png

1.想定される利用目的

・読み込んだデータの概要確認

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2022-08-03 10.34.30.png

[テーブル]ノードのウィンドウにレコード数(行数)とフィールド数(列数)

a.入力するデータは以下の通りです。[テーブル]ノードのヘッダーに[2フィールド,93レコード]と表示されるためこの時点でテーブル全体が93行だとわかります。
スクリーンショット 2022-08-03 10.33.07.png

レコード集計を設定しないでプレビューする

b.[レコード集計]ノードを何も設定しないでプレビューします。読み込んだデータの行数を最も早く知る方法です。SQLプッシュバックが有効の場合はSQLで集計済みの値のみを返すため高速処理が期待できます。
スクリーンショット 2022-08-03 10.37.39.png

SQLプッシュバックは以下の記事で解説しています。

c.bと同じで何も設定していません。
スクリーンショット 2022-08-03 10.37.13.png

d.[テーブル]を実行します。bと同じレコード数のみが表示されます。
スクリーンショット 2022-08-03 10.37.39.png

IDのユニーク数を確認する

e.[レコード集計]ノードを編集します。[キーフィールド]に[ID]を選択し、[フィールドにレコード度数を含める]からチェックを外します。
スクリーンショット 2022-08-03 10.39.00.png

[プレビュー]します。IDをキーにしたのでIDのリストが表示されます。
スクリーンショット 2022-08-03 10.40.05.png

f.[レコード集計]ノードを編集します。ひとつ前のテーブルのレコード数がIDの行数になるため[キーフィールド]をブランク、[フィールドにレコード度数を含める]にチェックを入れます。
スクリーンショット 2022-08-03 10.40.35.png

g.[テーブル]ノードを実行します。
スクリーンショット 2022-08-03 10.41.13.png

注意事項

aで読み込むテーブルの規模が小さい場合には問題ありませんが、大規模な場合全レコードを表示するのに時間がかかり、Serverやクラウドにデータが存在する場合トラフィックに負荷がかかります。そのためレコード集計とサンプリングを効果的に利用してデータ理解を進めることをお勧めします。

4.参考情報

[レコード集計]ノードを扱った記事

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?