はじめに
時系列データから平均値や最大値を求める特徴量はよく作ると思いますが、「時間」に着目した特徴量も重要です。捉えたい事象がどのくらいの時間発生していたかという「時間」が説明力の高い特徴量になることがよくあります。SPSS Modelerで時系列データからそのような「時間」の特徴量を作ってみます。
この記事はSPSS秋のユーザーイベント2024の東日本旅客鉄道の堀様のご講演の「ものづくり領域で活かされるSPSSの今とこれから-2異常検知と自動化」でご紹介したデモ①「時系列データから『時間』の特徴量を作る」の解説です。
『実践! 異常検知と故障予測―IBM SPSS ModelerによるIoT時系列データ活用』(東京図書)の「1-3 実務で使える異常検知」(p.78-96)の一部を簡略化してご紹介しています。詳しい内容をお知りになりたい方はぜひ書籍もご参照いただければと思います。
■テスト環境
- Modeler 18.5
- Windows 11 64bit
テストデータ
テストデータは以下のような時系列データです。「製品切替Bボタン」が押された00:09から「温度」が210度に上がる00:12までの3分間という時間を特徴量として取り出したいと思います。
データの可視化
「時系列グラフ」ノードで、系列に「温度」「製品切替Aボタン」「製品切替Bボタン」を設定し、X軸ラベルに「時刻」に設定し、「別のパネルに時系列を表示」にチェックを付けます。
以下のようなデータです。
「製品切替Aボタン」が押されると「温度」が150度まであがり、製品Aが製造され、「製品切替Bボタン」が押されると「温度」が210度まで情報して製品Bが製造されることを示しています。
そしてここでは「製品切替Bボタン」が押されてから「温度」が210度に上がるまでの時間を特徴量として抽出していきます。赤の横棒の長さがそれを示しています。「製品切替Bボタン」は3回押されていますので、3つの特徴量が得られます。
説明変数の作成
「フィールド作成ノード」をつなぎ以下の設定をします。
「ステート型」にします。
フィールド名:「B製造」
スイッチ”オン”の条件式:「製品B切替ボタン=1」
スイッチ”オフ”の条件式:「製品A切替ボタン=1」
以下のように「製品B切替ボタン」が押されると「1」のフラグが立ち、「製品A切替ボタン」が押されるとフラグが降ります。
次も「フィールド作成ノード」をつなぎ以下の設定をします。
「カウント型」にします。
フィールド名:タイムカウント
初期値:「-1」←製品Bの開始のタイミングは0にしたいので「-1」としています。
増分条件:「B製造=1」←製品B製造中に1ずつカウントが増えます。
増分:「1」
リセット条件は「B製造=0」
以下のように「B製造」のフラグの立っている間カウントが増えます。つまり製品Bが製造されている間の「分」を示す値が作れました。
「条件抽出ノード」をつなぎ、以下の設定をします。
「条件」に「B製造 = 1 and 温度 >= 210 and @OFFSET(温度,1) < 210
」を設定します。
Bの製造が始まっていて、温度が1レコード前では210未満で、210度になったタイミングのレコードを抽出しています。
結果
結果は以下のようになります。製品Bは3回製造されたので3レコードが抽出されています。それぞれ3分間、3分間、10分間という結果になっています。もしかすると10分間という時間は長く不良の予兆であるかもしれません。
「時間」の特徴量を作る事ができました。
なお、複数の工場に対してこの特徴量をループでつくる記事もありますので、参考にしてください。
サンプル
サンプルストリーム
サンプルデータ
参考
20241127SPSS秋02_東日本旅客鉄道 堀様資料
『実践! 異常検知と故障予測―IBM SPSS ModelerによるIoT時系列データ活用』(東京図書)
SPSS Modelerのループでパラメーターを与えて特徴量を生成