はじめに
外れ値に強い周期性解析の手法を提案していますが、今回新たに欠損値(NaN)にも対応する関数を追加してみました。
外れ値に強い点については、以下の記事で紹介しています。
実データでは欠損値が含まれるケースも多いため、そのまま周期性解析にかけられるようにするのが目的です。
欠損値対応について
基本的な方針はシンプルで、欠損値を含むサンプルは計算から除外しています。
そのため、
- 使用されたサンプル数が変動する
- 周期ごとの信頼性が変わる
といった特徴があります。
この影響を確認できるように、有効サンプル率(valid ratio)も合わせて出力するようにしています。
実装上のポイント
通常の周期性解析と比較すると、以下の違いがあります:
- NaNを含むペアはスキップ
- 分母(正規化)も有効サンプル数ベースに変更
シンプルな変更ですが、欠損値をそのまま扱えるようになります。
GitHubリポジトリ
おわりに
簡単な実装ですが、欠損値を含むデータに対してそのまま周期性解析を適用できるようになりました。
一方で、欠損率やデータの性質によっては結果が安定しない可能性もあるため、その点は今後検証していきたいと思います。
よかったら試してみてください。