はじめに
電力使用量予測のセミナーをしていて、各電力会社の公表されている過去の使用電力量の形式がまちまちなので取得するのが難しいというご意見を聞いていました。
そこで、それぞれの電力会社別にデータの取得方法をまとめてみます。
ちなみに、対象とする電力会社は、北海道電力、東北電力、東京電力、北陸電力、中部電力、関西電力、中国電力、四国電力、九州電力、沖縄電力で、今回は中国電力さんを扱ってみます。
注:大量のダウンロードを繰り返すとサーバに負担がかかるので、ダウンロードは一回だけにするか、対象期間を限定して行うよう心がけて下さい。
動作環境
GoogleさんのCoraboratoryという環境で動作させます。
Webサイト
以下のWebサイトからデータをダウンロードできそうです。
ダウンロード
for y in range(2016, 2020):
url = "https://www.energia.co.jp/nw/jukyuu/sys/juyo-{:04}.csv".format(y)
print(url)
!wget $url
2020年9月現在、実行してみると2018年4月からのデータまで公開されているようです。
読込と可視化
from glob import glob
import pandas as pd
files = glob("j*.csv")
files.sort()
print(files)
df_juyo = pd.DataFrame()
for f in files:
df = pd.read_csv(f, skiprows=2, encoding="Shift_JIS")
df_juyo = pd.concat([df_juyo, df])
print(df_juyo.shape)
print(df_juyo.columns)
df_juyo.index = pd.to_datetime(df_juyo["DATE"] + " " + df_juyo["TIME"])
df_juyo["実績(万kW)"].plot(figsize=(15,5))
できた!
過去の電力使用量実績は公開を終了される場合もあるので、継続的なデータ収集が必要ですね。
電気使用量を見ると、色々な気付きがありますね。
以上、現場からきむらがお伝えしました。
補足
記事を読んだ人から「時間がかかり過ぎるので、手っ取り早くデータが欲しい場合にはどうしたら良いか?」という質問があったので、ちょっとだけデータを販売してみることにしました。
データに興味があれば以下のURLをご覧下さい。