1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

欠損値を中央値で置換する(SPSS Modeler データ加工逆引き5-6)

Last updated at Posted at 2022-07-07

欠損値を中央値で置換(欠損値の補完)

スクリーンショット 2022-07-06 16.12.09.png

1.想定される利用目的

・顧客属性データの補完
・設備IoTデータの欠損値の処理

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2022-07-06 16.12.21.png

a.入力するデータは以下の通りです。

スクリーンショット 2022-07-06 16.13.57.png

[データ検査]ノードを利用する方法

b.[データ検査]ノードを編集し赤枠にチェックをして実行します。
スクリーンショット 2022-07-06 14.10.02.png

[欠損値検査]タブを開き[欠損値の代入]を[空白およびヌル値]に。[代入方法]は[固定]をクリックして[設定値のダイアログ]から[中央値]を選択します。
スクリーンショット 2022-07-06 16.17.55.png

[生成]メニューから[欠損値スーパーノード]を選択するとcと同じものがストリーム領域に生成されます。
スクリーンショット 2022-07-06 16.19.03.png

c.スーパーノードの中見は以下の通りです。[データ検査]ノードで選択した時点で中央値[44.6]が埋めこまれました。
スクリーンショット 2022-07-06 16.19.21.png

[プレビュー]します。欠損値が最頻値に置き換わりました。
スクリーンショット 2022-07-06 16.19.42.png

統計値をテーブル結合してから置換える方法

ストリームが最新データを受けてCADSなどで自動化されることを考慮した方法です。

d.[レコード集計]ノードを編集します。[キー]はブランクで[値]の[中央値]を選択します。
スクリーンショット 2022-07-06 16.20.06.png

[プレビュー]します。中央値は[44.6]です。
スクリーンショット 2022-07-06 16.20.22.png

e.[テーブル結合]ノードを編集します。[レコード結合方法]は[キー]をブランクにしてN対Nの結合を行います。
スクリーンショット 2022-06-29 17.33.40.png

[プレビュー]します。
スクリーンショット 2022-07-06 16.21.12.png

f.[置換]ノードで欠損値を中央値に置換えます。
スクリーンショット 2022-07-06 16.22.01.png

[プレビュー]します。欠損値が中央値に置き換わりました。
スクリーンショット 2022-07-06 16.22.28.png

注意点

中央値の計算はSQLの特性上プッシュバックが効きません。処理速度を考慮して利用を検討ください。

4.参考情報

[データ検査]ノードの解説記事

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?