1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

欠損値を前後の値の平均で補間する(重複レコード)(SPSS Modeler データ加工逆引き5-19)

1
Posted at

欠損値を前後の値の平均で補間する(重複レコード)

スクリーンショット 2025-10-02 10.15.09.png

*逆引き5-20で関数@￰SCINCEを利用して処理するストリームを紹介しています。

1.想定される利用目的

・時系列モデル作成のための欠損値の処理
・設備IoTデータの欠損値の処理

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2025-10-02 10.15.43.png

a.入力するデータは以下の通りです。

スクリーンショット 2025-10-02 10.06.28.png

b.[フィールド作成]ノードを編集します。欠損値の連続を考慮した通し番号を作成します。列方向に参照するオフセット関数を利用します。[@￰OFFSET(フィールド,1)]でフィールドの値の1行上を参照します。

スクリーンショット 2025-10-02 10.17.26.png

[プレビュー]します。何期連続しても欠損値はひとつのグループだと識別しています。

スクリーンショット 2025-10-02 10.17.45.png

c.[重複レコード]ノードを編集します。

スクリーンショット 2025-10-02 10.18.03.png

[プレビュー]します。

スクリーンショット 2025-10-02 10.18.20.png

d.[フィールド作成]ノードを編集します。置換では1期先読みができないので新しい列として欠損補間します。

スクリーンショット 2025-10-02 10.18.36.png

[プレビュー]します。

スクリーンショット 2025-10-02 10.19.01.png

e.[フィルター]ノードを編集します。

スクリーンショット 2025-10-02 10.19.14.png

f.[レコード結合]ノードを編集します。欠損値の連続をまとめて計算していますので本来のレコードに割り当てます。

スクリーンショット 2025-10-02 10.19.29.png

[プレビュー]します。

スクリーンショット 2025-10-02 10.19.59.png

g.[フィルター]ノードを編集します。

スクリーンショット 2025-10-02 10.20.14.png

h.[ソート]ノードを編集します。

スクリーンショット 2025-10-02 10.20.30.png

[テーブル]を実行します。

スクリーンショット 2025-10-02 10.06.51.png

注意点

レコードの最初と最後が欠損値ではない前提で作成されています。そのような可能性がある場合には
平均ではなく同じ値を補うなどのルールを設定する必要があります。

4.参考情報

時系列の欠損値を線形補間する

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?