pythonで時系列データをぽちぽち vol.0
こんばんは.ひさびさに時系列データをいじることにしました.
一連の分析の流れをシリーズにして,まとめようと思います.
もしかするとお役に立てる部分があるかも.
こんな人に読んで欲しい
- 時系列データ分析に興味がある人
- python,pandasで時系列データをいじろうとしてる人
- データはあるがなにしていいかわからない人
- 東京電力の電力使用実績に興味のある人
pandasでの時系列データの操作方法については,多くの素敵な記事があります.どれも参考にすべきものばかりです.でも,手元にあるデータを前に,なにからはじめていいかわからないから,なにを読めばいいかすらわからない人がいると思うんです.(僕がそうだったように)
目的:時系列データをいじる方法を,一連の流の中で説明すること
そこで,一連の流れで説明すれば,イメージも湧くんじゃないかなって思いました.今回は,東京電力の過去の電力実績データを使ってやっていきます.時系列データの操作云々だけじゃなく,電力実績ってどんな風になってるのかもわかる記事にしたいと思います.
時系列データのイケてるところって,やっぱり予測できるとこ
だと思うんですよ.あくまで僕の主観ですが...いかにも,データ分析っぽいカッコいいとこ!!!だなって.
ただ,予測って先の先のそのまた先の話な部分があります.段階としては,大きく分けて
- 前処理
- 集計
- 分析(モデル化)
- 予測(汎化性能も加味したモデル化)
なので,このシリーズでは,1つ1つこうやって切って説明して,最後に予測手法の一例でも説明できれば嬉しいかなと思います.
では,ひとまず今日はここら辺で
今日のBGM:Norah Jones - Come Away with Me
追記:次回までの準備
Pythonのinstallやデータのダウンロード(.csvファイルでの保存)は,各自お願いしたいです.