LoginSignup
4
5

More than 1 year has passed since last update.

日大文系卒が学ぶ時系列解析① ~概念と用語紹介~

Last updated at Posted at 2022-08-08

初めに

タイトルの通り、日大私文卒が時系列解析を学んでいきます。
つまり、私みたいな人でも理解できる位に分かりやすく書くつもりなので温かく見守って頂ければ。

本記事は私のアウトプットです。そしてあなたの部下や同僚ほど優秀ではございませんので、ミスや解釈違いも多いでしょう。その際は指摘して頂ければ幸いです。

バックナンバーはこちら。

予備知識

python⇒本シリーズは 時系列解析&python というコンセプトです。

対数変換。いわゆるlog。⇒対数系列にて。必要に感じたら私も学習しqiitaに残します。現段階ではスルー。
matplotlib / seaborn ⇒pythonでグラフの視覚化をする技術。

学習

まずは概念と用語を確認します。理解ではなく確認で。ふわっとでも外観を捉えましょう。

時系列データ:時間の経過とともに変化するデータの事。

例えば…

  • 毎時間の気温の記録 / 会社の毎月の売上高記録 / 国のGDP推移記録 / 日経平均株価記録
  • 商品売上予測 / 来店者予測

それらを利用しできる事が過去の推移から未来の予測
そしてとにかく時系列データは視覚化する事が大事です。⇒matplotlib seaboneの出番ですね。

  • 早速具体例を確認してみましょう
    2022-08-07_02h03_32.png

これは2010年から2020年までの月ごとの平均気温をずらっとグラフにしたものです。

  • 夏は暑いし冬は寒い。そのような周期が12カ月ごとに繰り返されていく。
  • x軸が時系列。左側が古いデータで右側に進むにつれて新しくなっているなー。
  • 赤が時系列解析を用いて予測した月毎の平均気温で
    青が実際の月毎の平均気温。

その今手持ちにある時系列データを解析して未来の値を予測しようという学問です。

時系列データ:まず覚えるべき用語集

まずは重要キーワードを確認。まずはアンテナを沢山立てましょう。

トレンド

データの長期的な傾向の事です。
時間の経過とともにデータの値が上昇⇒正のトレンド。
時間の経過とともにデータの値が下降⇒負のトレンド。
例:賃金上昇率やGDP/自殺率等。

これ正のトレンド
2022-08-04_20h02_49.png

周期変動

時間の経過に伴ってデータの値が上昇と下降を繰り返えす。
特に1年間での周期変動を季節変動と言う。
例:季節関係のデータや賃金の支払い額(ボーナス)毎年6月と12月に増える みたいな。
こんなイメージ。

2022-08-04_22h07_57.png

不規則変動

時間の経過と関係なくデータの値が変動する。
例:地震や洪水などの自然災害、会社の不祥事などの株価大暴落のデータ等。

2022-08-04_22h08_42.png

実際には分類できなく組み合わさっている事も多い。

モデリング

時系列データを定式化する事。平たく言うと、時系列データを数式に変換する事です。
そして時系列データは原系列のままでは扱わないので
原系列対数系列/階差系列...等に加工数式化...例{x_(t+1)=a_0 x_(t-1)+a_1 x_t}

  • じゃあどうやってモデリング(数式化)するの?という話なのですが、
    ARMA(アーマ)、ARIMA(アリマ)、SARIMA(サリマ)etc、というモデルを使用してモデリングを行います。
    勿論このシリーズでその聞きなれない単語も解説する予定です。

  • モデルを用いてモデリングし、様々な予測を行い、相互関連を分析する事が時系列分析の目的です。

ここで私の考えた例を一つ。

原系列         ⇒ 材料
ARMA/ARIMA/SARIMA  ⇒ 調理方法(炒める/煮る/炒めて煮る)
モデリング後     ⇒ 出来上がった料理
考察         ⇒ 良い!or 悪いもう一回作り直せ!

定常性

どんな時点、どんな時間差でも目立った変化ないデータ。
つまり現在や過去と比較してもあまり意味がないデータ。時間の影響を受けないしトレンドも持たない。

  • 具体例やイメージ:真空の気体の状態… 一定の電圧のデータ

時間の経過によらず一定の値を軸とし、同程度の幅で振れて変化する
因みに現実世界には、こうしたデータはほとんど存在しません。

詳しくはこちら

定常性があるデータ:時系列の影響が少ないデータ。時系列解析に使えない or 使うには加工が必要

時系列の進化先

時系列データは調査して性質を探り加工する事によって分析を進める事が出来ます。
つまりそのままの状態では使い物にならないから加工しよう。という話ですね。

  • 原系列 :そのままの状態の時系列データ
  • 対数系列 :原系列データに対して対数変換をかけたもの。
  • 階差系列(差分系列)基準点とその一つ前の点との違いを見る。
    今日の温度と昨日の温度の比較等。差分を取る⇒トレンドを除去したデータにすることが期待できる。
  • 季節調整済み系列:現系列から季節変動を取り除いたもの。⇒トレンドや他の情報が可視化が期待できる。

この例が的確かどうか保証は致しかねますが...。

イーブイの進化先
イーブイ:原系列  ブースター:対数系列 シャワーズ:階差系列・・・
みたいに複数の進化先があるみたいな…。

終わりに

いかがでしょうか?正直まだまだ、グラフの資料が足りなかったり、説明不足や解釈の勘違いも多いと思います。随時更新/追加予定ですので、長い目で見てやってください。
「時系列の進化先」の部分が特に説明不足と感じましたので、後ほど詳細ページを作成できればと思います。因みに次回は自己相関関数やコレログラム、波形分解と定常性について学習するつもりです。続きはこちら

参照

4
5
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
5