1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

空白/空文字レコードを確認して削除/抽出する(SPSS Modeler データ加工逆引き5-7)

Last updated at Posted at 2022-07-20

空白/空文字レコードを確認して削除/抽出(欠損値/空白の削除と抽出)

スクリーンショット 2022-07-13 11.02.57.png

1.想定される利用目的

・顧客属性データのクレンジング
・設備IoTデータの欠損値の処理

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2022-07-13 13.46.36.png

a.入力するデータは以下の通りです。

スクリーンショット 2022-07-13 11.08.50.png

[テーブル]ノードから削除/抽出のノードを自動生成させる方法

b.[レコード集計]ノードを編集します。
スクリーンショット 2022-07-13 11.12.29.png

[テーブル]ノードを実行します。種別が空白(この時点では見た目は同じ)のふたつのセルを指定したままメニューから[条件抽出ノード(OR)]を選択します。
スクリーンショット 2022-07-13 11.13.04.png

c.[条件抽出]ノードが自動生成されます。空文字("")と空白文字(" ")の2種類が存在しておりor条件で[破棄]します。
スクリーンショット 2022-07-13 11.13.33.png

[プレビュー]します。
スクリーンショット 2022-07-13 11.14.30.png

d.[条件抽出]ノードを複製して[破棄]から[含める]へ選択を切り替えます。
スクリーンショット 2022-07-13 11.13.54.png

[プレビュー]します。
スクリーンショット 2022-07-13 11.14.58.png

[データ検査]ノードを利用する方法

e.[データ検査]ノードを実行します。有効なレコードは5件で2件は空白文字(うち空文字が1)だとわかります。
[種別]の行を選択したまま以下のメニューを選びます。
スクリーンショット 2022-07-13 11.16.17.png

[テーブル]で選択したフィールドを選択しています。
スクリーンショット 2022-07-13 11.17.14.png

f.[条件抽出]ノードが自動生成されます。c同様に空白レコードを抽出します。
スクリーンショット 2022-07-13 11.18.04.png

g.fの反対のモードです。dと同様に該当レコードを破棄します。
スクリーンショット 2022-07-13 11.58.55.png

注意点

空白と空文字は見た目は同じですが、区別されて処理されますので注意します。

4.参考情報

[データ検査]ノードの解説記事

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?