皆さんこんにちは。
今日はその2の続きでOracle Analytics Cloud の機械学習のモデルの話をします。
その2ではARIMAモデルの
「回帰」というキーワードで引っかかってしまい、その3の閑話休題に話が飛んで行ったかと思います。以前、季節性ARIMAモデル、ARIMAモデルは類似のモデルであるため、データ内容によって(季節性のあり/無しで)適用するのが良いという話をしました。
ARIMAモデル同様、ETSはExponential Smoothing State Space Modelの「頭文字」を使っています。
名前はさておき、検索をしてみると
・より直近の過去値からの影響を重視し、過去になればなるほど指数関数的に影響が小さくなるモデル
・普通の加法型誤差項だけでなく乗法型誤差項も可能なモデル
・以上の制約のもとで状態空間モデルにまとめたもので、モデル推定は観測値ではなく状態値に基づく
ちょっと何言ってるかわかりませんね。。。
また、一つ一つ解説していきましょう。
指数関数は高校の数学で出てきます。グラフを見ると「記憶の隅にかすかに・・・」となると思います。
下式で表すxの関数です。aを「底(てい)」といい、0より大きく1以外の定数です。
xの値が小さいほどyは0に近づき、xの値が大きいほどyも大きな値になります。
「だから何?」といわずにもう少しお付き合いください。
指数関数ともう一つの難題である「状態空間モデル」についても少し解説します。
状態空間モデルは、ほとんどの時系列モデルを表現できる汎用性の高い時系列分析のモデルです。状態空間モデルは、
・観測できない隠れた「状態モデル」
と
・観測した結果である「観測モデル」
からなります。
例えば観測モデルは株価の実績値、状態モデルとは観測できないものですので市況データなどです。
状態空間モデルでは様々な要因を分解して時系列予測を行うため、データ間の関連性や影響具合を明らかにすることが可能で、マーケティングの意思決定へつなげやすくなっています。
先ほどのxの値の大きさでyの値が変わっていくという話がようやくつながってきました。
また、「より直近の過去値からの影響を重視し、過去になればなるほど指数関数的に影響が小さくなる」ということも影響しそうです。
古くからよく知られる時系列解析モデルとしてその1から解説してきた、MAモデル、ARモデル、ARMAモデル、ARIMAモデルがあり、これらのモデルでカバーできない時系列データに対して、ETSモデルは威力を発揮します。
まずは自社データの状態がどうなっているかをよくご覧になってみて下さい。
そしてデータがそろっているのか、他の要素を入れるとどうなるのか、様々な角度からOracle Analytics Cloud を使って分析をし、自社にあったモデルはどれだろうと考えながら適用なさってみてはいかがでしょうか。
検索すると、たくさん情報は出てきますが専門用語が駆使されていて拒否反応が出た方も多くいらっしゃると思います。一つ一つ丁寧に見ていくことで、理解が進むお手伝いができていれば幸いです。