空白/空文字レコードを確認して削除/抽出(欠損値/空白の削除と抽出)
1.想定される利用目的
・顧客属性データのクレンジング
・設備IoTデータの欠損値の処理
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
a.入力するデータは以下の通りです。
[テーブル]ノードから削除/抽出のノードを自動生成させる方法
[テーブル]ノードを実行します。種別が空白(この時点では見た目は同じ)のふたつのセルを指定したままメニューから[条件抽出ノード(OR)]を選択します。
c.[条件抽出]ノードが自動生成されます。空文字("")と空白文字(" ")の2種類が存在しておりor条件で[破棄]します。
d.[条件抽出]ノードを複製して[破棄]から[含める]へ選択を切り替えます。
[データ検査]ノードを利用する方法
e.[データ検査]ノードを実行します。有効なレコードは5件で2件は空白文字(うち空文字が1)だとわかります。
[種別]の行を選択したまま以下のメニューを選びます。
f.[条件抽出]ノードが自動生成されます。c同様に空白レコードを抽出します。
g.fの反対のモードです。dと同様に該当レコードを破棄します。
注意点
空白と空文字は見た目は同じですが、区別されて処理されますので注意します。
4.参考情報
[データ検査]ノードの解説記事
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)