はじめに
電力使用量予測のセミナーをしていて、各電力会社の公表されている過去の使用電力量の形式がまちまちなので取得するのが難しいというご意見を聞いていました。
そこで、それぞれの電力会社別にデータの取得方法をまとめてみます。
ちなみに、対象とする電力会社は、北海道電力、東北電力、東京電力、北陸電力、中部電力、関西電力、中国電力、四国電力、九州電力、沖縄電力で、今回は関西電力さんを扱ってみます。
注:大量のダウンロードを繰り返すとサーバに負担がかかるので、ダウンロードは一回だけにするか、対象期間を限定して行うよう心がけて下さい。
動作環境
GoogleさんのCoraboratoryという環境で動作させます。
Webサイト
以下のWebサイトからデータをダウンロードできそうです。
ダウンロード
for y in range(2016, 2020):
for m in range(1,13):
url = "https://www.kansai-td.co.jp/yamasou/{:04}{:02}_jisseki.zip".format(y, m)
print(url)
!wget $url
from glob import glob
files = glob("*.zip")
files.sort()
for f in files:
!unzip $f
読込と可視化
from glob import glob
import pandas as pd
files = glob("2*.csv")
files.sort()
df_juyo = pd.DataFrame()
for f in files:
print("\r", f, end="")
try:
df = pd.read_csv(f, encoding="Shift_JIS", skiprows=10, nrows=24)
d = df.DATE + " " + df.TIME
except:
df = pd.read_csv(f, encoding="Shift_JIS", skiprows=16, nrows=24)
#df.tail(25)
#df.head()
df_juyo = pd.concat([df_juyo, df])
print(df_juyo.shape)
print(df_juyo.columns)
df_juyo.index = pd.to_datetime(df_juyo["DATE"] + " " + df_juyo["TIME"])
df_juyo = df_juyo.sort_index()
df_juyo["当日実績(万kW)"].plot(figsize=(15,5))
できた!
エリアの人口が多いので、必然的に多くの電力が使用される地域になっています。
電気使用量を見ると、色々な気付きがありますね。
以上、現場からきむらがお伝えしました。
補足
記事を読んだ人から「時間がかかり過ぎるので、手っ取り早くデータが欲しい場合にはどうしたら良いか?」という質問があったので、ちょっとだけデータを販売してみることにしました。
データに興味があれば以下のURLをご覧下さい。