0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

生年月日の列から年齢と年代の列を作成する(SPSS Modeler データ加工逆引き1-10)

Last updated at Posted at 2022-08-21

生年月日の列から年齢と年代の列を作成(浮動小数点の誤差を考慮)

スクリーンショット 2022-08-08 13.19.12.png

1.想定される利用目的

・予測モデル作成のための顧客属性の加工
・予測モデル作成のための設備/部品情報の加工

2.サンプルストリームのダウンロード

3.サンプルストリームの説明

スクリーンショット 2022-08-08 13.20.54.png

a.入力するデータは以下の通りです。
スクリーンショット 2022-08-08 13.12.18.png

b.[フィールド作成]ノードを編集します。正確に日付けの差を計算するには、まず1900年1月1日を基準日(設定変更可能)として、そこから起算日が何秒経過しているのか[datetime_in_seconds(フィールド)]で求めます。次に7日分の秒数を加えて、最後に[datetime_day(フィールド)]で日付に戻します。
スクリーンショット 2022-08-08 13.23.26.png

年月の差の計算については以下の記事で解説しています。

式ビルダーの日付関数を利用すると便利です。

[プレビュー]します。
スクリーンショット 2022-08-08 13.40.59.png

c.[フィールド作成]ノードを編集します。[派生]モードを[名義型]にしてそれぞれの年代の条件式を記述します。
スクリーンショット 2022-08-08 13.25.15.png

[プレビュー]します。
スクリーンショット 2022-08-08 13.27.31.png

棒グラフからバンド分割

ヒストグラムで分布を確認しならがらマウスで閾(しきい)値を決めて分割の自動生成をする方法は以下で紹介しています。数値を大きくバンドでグループ化してから値を整えるやり方がおすすめです。

注意事項

おおよその年の経過の場合にはdate_years_differenceを用います。この場合は以下のように浮動小数点の処理で誤差が生じます。

d.[フィールド作成]ノードを編集します。
スクリーンショット 2022-08-08 13.27.54.png

e.[フィールド作成]ノードを編集します。dの値を整数化しています。
スクリーンショット 2022-08-08 13.28.25.png

[プレビュー]します。2行目と4行目は小数点が切り捨てられ、先の出力と異なり不正確な結果になります。
スクリーンショット 2022-08-08 13.29.09.png

こちらの記事でも浮動小数点による誤差を扱っています。

4.参考情報

よく使う「日付と時間」関数

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?