この記事は古川研究室 Advent_calendar 1日目の記事です。
本記事は古川研究室の学生が学習の一環として書いたものです。内容が曖昧であったり表現が多少異なったりする場合があります。
はじめに
時系列データについて、定義など触りの部分だけではありますが、簡単にまとめた記事です。
時系列データを扱っているのだということ、また時系列データを見る際に注意する事柄、
これら2つの意識を自分の中に育てることを目的とします。
タイトルに一瞬でもご共感いただいた方は、短い間ですので、一読いかがでしょうか。
おしながき
- 時系列データってなに
- 定義
- 例
- 測定間隔
- 短期的な小さな動き、長期的な大きな動き(トレンド)
- 時系列データを扱う目的
- 可視化
- 解析
- 予測
- 意思決定、制御
##時系列データってなに?
時系列データの定義
時系列(time series): 何かしらの現象の、時間的変化の記録
X = \{ x_{1}, x_{2}, ..., x_{t} \}
数式では上記のように、時刻 $t=1$ での数値 $x_1$ 、時刻 $t=2$ での数値 $x_2$ 、同様に時刻 $t$ での数値 $x_t$ 、そしてそれらをまとめた系列 $X$ が時系列データとすることで書くことができます。
時系列データの例
例えば身近なところでは、自宅の電気使用量の変化を(適当ですが)上記のように想像してみると、冷蔵庫など常に電気を消費しているものや、朝起きて電気をつけた場合に増え、また昼頃出かけて減り、夜に帰ってきてまた増え....のようになると予想されます。
ほかに思いつくだけでも、ガス・上下水道・ゴミ...生活しているだけで時系列データはいくつも生まれ、また計測され、蓄積されていたということですね!
測定間隔
忘れてはならないのが、時系列データには測定間隔 $\Delta t$ が存在します。1秒、1日、一週間、1か月、1年など目的により様々です。例えば音声をはじめとする周期的な信号であれば、その周期に関係する重要な項目です。
先ほどの電気使用量の例は一日のうちの変化を表していましたが、これを一日ごとに足し合わせて記録していけば、それはひと月の電気使用量の変化に、
さらに足し合わせて記録していけば年間の電気使用量の変化になります。
この測定間隔が時系列データを扱う際のポイントその1です。
データを取得する際にはもちろんですが、誰かのデータを利用することのほうが多い現代です。
なぜその測定間隔になっているのか、に気を配りたいものです。
特に、平均が見たい、相関が見たい、などデータに処理を施す場合があります。
その際には特に気を付けたいです。
短期的変化と長期的変化
時系列データを見て情報を引き出したいとき、注目するポイントを選択する必要があります。
1.細かい変動を無視して、時系列の長期的な変化(トレンド)を見る
2.トレンドを除去して、時系列の短期的な細かい変動を見る
よく例に挙がるのは株価の変動データでしょうか。
細かい売り買いは無視して、株価の変動が上昇傾向である・下降傾向であるなど全体の傾向を掴みたい場合は前者、
反対にある一日の細かい売り買いを見たい場合には後者、といったようにどちらに注目するか選ぶことになります。
この、短期的変化と長期的変化のどちらに注目するかが、時系列データを扱う際のポイントその2です。
図1 で挙げた電気使用量の例で言えば、
1.トレンドを見ると、その家の生活リズムがわかるかもしれません
(いつごろ起きて、いつごろ出かけて、いつごろ帰ってきたかなど)
2.短期的変化を見ると、時間帯ごとの行動がわかるかもしれません
(夕飯時なら、料理を始めたことなど)
ちょっと例がイマイチかもしれませんが、このように時系列データを扱う際は
トレンド と 短期的変化
のどちらを見たいのか意識します。
時系列データを扱う目的
膨大な量になるのでこの記事では触れませんが、簡単には
①可視化
②情報抽出
③予測
④意思決定、制御
上記の4段階があります。
気象予報の例で考えるとわかりやすく、
①可視化
各地の雲量や気温変化などを可視化します
(棒グラフなど見慣れたものもこれに当たります)
②情報抽出
可視化したグラフなどをもとに降雨と気温の変化に関係を見出すなど、情報を引き出します
(ここで平均や相関を見るなど、統計的な解析を行います)
③予測
雲量や気温、各時系列のトレンドの周期性などから将来の予測を立てます
(予測のためのモデルが研究、提案されています)
④意思決定、制御
予測をもとに、予報を決定します
(予報を見た人はこれを受けて傘を用意しますし、他の例では機械の計測データであれば次の時刻の制御に利用します)
自分が目の前の時系列データを扱う目的はどれに当たるのか考えると、必要な解析手法が見えてきそうですね。
おわりに
本当に触りの触りだけですが、「意識を持つ」という目的で簡単にまとめてみました。
私はきっかけがあったため、時系列データ解析について調べることになりました。
この記事が誰かのきっかけになれれば幸いです。
参考文献
[1] 東京大学 数理・情報教育研究センター スライド教材 4-4 時系列データ解析
http://www.mi.u-tokyo.ac.jp/consortium2/pdf/4-4_literacy_level_note.pdf
[2] esri ジャパン 時系列データとは
https://www.esrij.com/gis-guide/other-dataformat/temporal_data/#:~:text=%E6%99%82%E7%B3%BB%E5%88%97%E3%83%87%E3%83%BC%E3%82%BF%E3%81%A8%E3%81%AF%E3%80%81%E6%B0%97%E6%B8%A9%E3%81%AE%E9%81%B7%E7%A7%BB%E3%82%84%E9%99%8D%E6%B0%B4,%E3%81%9F%E3%82%81%E3%81%AB%E5%88%A9%E7%94%A8%E3%81%95%E3%82%8C%E3%81%BE%E3%81%99%E3%80%82
[3] BellCurve 統計WEB 3.時系列データ
https://bellcurve.jp/statistics/course/18923.html