折れ線グラフでフラグの色分け表示をする
1.想定される利用目的
・対象の違いによる時系列データの比較
2.サンプルストリームのダウンロード
- ストリーム
https://github.com/hkwd/spsssample/raw/refs/heads/master/250602overlay/250602overlay1.str - データ
https://github.com/hkwd/spsssample/raw/refs/heads/master/250602overlay/03%E9%9B%BB%E5%8A%9B%E3%83%87%E3%83%BC%E3%82%BF.csv
* テスト環境
* Modeler 18.6
* Windows 11
3.サンプルストリームの説明
a.入力するデータは次の通りです。
稼働日数の時系列で電力が記録されており、不良フラグが0と1のデータが入っています。

b.[データ型]ノードで「値を読み込み」、「不良」フラグの尺度を「フラグ型」に設定し、「OK」で閉じます。連続型のままだと色味が濃さで表現されるため見づらくなってしまいます。

c.[ソート]ノードで「値を読み込み」、「不良」を「降順」ソートし、「稼働日数」を「昇順」でソートします。

以下のようにまず不良のデータが稼働日数順に並び、次に正常のデータが稼働日数順に並びます。

c.[散布図]ノードの「プロット」タブで「Xフィールド」に「稼働日数」、「Yフィールド」に「電力」、オーバーレイの「色」に「不良」を選びます。[線グラフ]ノードではなく、[散布図]を使わないとフラグのオーバーレイができないことに注意してください。

「オプション」タブで、スタイルに「線」を選び、Xモードを「オーバーレイ」にし、実行します。
稼働日数が30を超えたあたりから、不良の有り無しで電力の落ち方の動きに違いがあることが比較できます。

読みやすさのためのヒント
「不良」フラグの尺度はフラグ型
「不良」フラグが「フラグ型」ではなく、「連続型」のままだと色味が濃さで表現されるため見づらくなってしまいます。

「不良」フラグの優先したい色を後になるようにソート
グラフ上でデータが重なる場合、後半にあるデータが優先されて表示されます。レコードの並び順で不良フラグの「正常」(0)と「異常」(1)のどちらが後になるかで、グラフの雰囲気が変わることもありますので、強調したいものが何かを考えて、ソートしてください。
[線グラフ]ノードでの表示
フラグのデータのままの場合は、[線グラフ]ノードではオーバーレイ(色分け)ができませんが、再構成と集計で横持にすることで、[線グラフ]ノードで表示することも可能です。
以下のように電力を不良フラグ毎の列にした、横持のデータになります。

以下のように[線グラフ]ノードの別系列として色分けできます。

逆に言うと、縦もちのフラグデータのままでも折れ線グラフを描けることが、Modelerの[散布図]ノードの手軽なところとも言えます。
4.参考情報
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)






