kaggle に出てくるstatsmodelsの日本語訳です。後半は
を訳していきます。
class statsmodels.tsa.deterministic.DeterministicProcess
(index, *,
period=None,
constant=False,
order=0,
seasonal=False,
fourier=0,
additional_terms=(),
drop=False)
決定論的項を管理するためのコンテナクラスです。
このクラスは、定数項、時間トレンド、そして単一周期に対する季節ダミーまたはフーリエ項のいずれかを直接扱うことができます。コンストラクタで初期化できるものに加えて、追加の決定論的項を追加することも可能です。
引数
index : {Sequence[Hashable], pd.Index}
対象となるデータのインデックス。予測モデルを構築する際には、通常は学習用データのインデックス (サンプル内インデックス) を指定します。
period : {float, int}, デフォルトは None
季節性またはフーリエ項の周期。季節ダミーを使用する場合は整数で指定する必要があります。指定されない場合、インデックスから周期 (freq) が読み取られます (可能な場合)。
constant : bool, デフォルトは False
定数項を含めるかどうかを指定します。
order : int, デフォルトは 0
時間トレンドの次数を指定します。例えば、2 を指定すると、線形トレンド (1次) と二次トレンド (2次) の両方が含まれます。0 を指定すると時間トレンド項は除外されます。
seasonal : bool, デフォルトは False
季節ダミーを含めるかどうかを指定します。
fourier : int, デフォルトは 0
使用するフーリエ項の次数を指定します。
additional_terms : Sequence[DeterministicTerm]
追加で使用する決定論的項を DeterministicTerm
オブジェクトのリストとして指定します。
drop : bool, デフォルトは False
項同士に完全な共線性がないかを確認し、線形従属な項を削除するかどうかを指定します。
属性
index
データのインデックス
terms
使用されている決定論的項のリスト
難しい表現の解説:
- 決定論的項 (deterministic terms): CalendarFourier の解説で説明した通り、確率的な要素を含まず、値が確定している項を指します。
コンテナクラス (container class): 他のオブジェクトをまとめて管理するためのクラスです。DeterministicProcess は、複数の決定論的項を terms 属性に保持し、それらをまとめて操作する機能を提供します。 - 共線性 (collinearity): 複数の変数間に強い相関関係がある状態を指します。特に、完全な共線性 (perfect collinearity) は、ある変数が他の変数の線形結合で完全に表される状態を指します。これは、回帰分析を行う際に問題を引き起こします (多重共線性)。
- 線形従属 (linearly dependent): ある変数が他の変数の線形結合で表される関係にあることを意味します。
まとめ
DeterministicProcess は、時系列データの決定論的な変動をモデル化するための強力かつ柔軟なツールです。様々な決定論的項を組み合わせて使用することで、複雑なパターンのある時系列データにも対応することができます。