0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

重複する不要なレコード(行)を削除する(SPSS Modeler データ加工逆引き7-6)

Last updated at Posted at 2022-07-28

重複する不要なレコード(行)を削除(distinct)

スクリーンショット 2022-07-22 10.04.37.png

1.想定される利用目的

・トランザクションやログからリストやマスタテーブルの作成
・新規テーブル作成のための前処理

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2022-07-22 10.25.35.png

a.入力するデータは以下の通りです。
スクリーンショット 2022-07-22 10.06.08.png

IDをキーにして重複を排除する

b.[重複レコード]ノードを編集します。[利用日]を降順ソートしてデバイスIDの最初のレコードを保持する設定です。
スクリーンショット 2022-07-22 10.10.25.png

[テーブル]を実行します。IDでユニークなレコード(行)になりました。
スクリーンショット 2022-07-22 10.11.25.png

c.[レコード集計]ノードでも同じ処理が可能です。
スクリーンショット 2022-07-22 10.11.05.png

姓と名が一致したらユニークと見なして重複を排除する

d.[重複レコード]ノードを編集します。[デバイスID]と[利用日]を降順ソートして姓名一致の最初のレコードを保持する設定です。
スクリーンショット 2022-07-22 10.11.53.png

[プレビュー]します。正しくできていますが並び順が姓名でソートされました。
スクリーンショット 2022-07-22 10.35.43.png

e.[ソート]ノードを編集します。
スクリーンショット 2022-07-22 10.12.09.png

[テーブル]を実行します。
スクリーンショット 2022-07-22 10.12.29.png

f.[レコード集計]ノードでも同じ処理が可能です。
スクリーンショット 2022-07-22 10.12.50.png

注意事項

[デバイスID]を整数型で扱っていたため[レコード集計]ノードで最大値として利用できました。IDが文字型の場合には[置換]ノードで関数[to_integer(フィールド)]を利用して変換します。

4.参考情報

重複処理について解説した記事

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?