#はじめに
Energy Management System(EMS)の分析を個人的にやりたい人が使えそうなデータセットを探してみました。
今回はNILM Datasetsという機器分離研究に役立つデータセットのリストの中から、EMS研究に使えそうなデータセットをピックアップして紹介してみます。
本記事ではこんなデータがありますよ〜という紹介のみで、中身の観察はFuture Workとします。
#【1】AMPds2: The Almanac of Minutely Power dataset (Version 2)
AMPds2はカナダ発の住宅エネルギー消費に関するデータセットで、元々機器分離の研究を促進するために公開されたものだそうです。Harvard Dataverse上で公開されています。
- データ概要
- カナダにあるデータ作成者の私宅(個人住宅)の測定データ(My Houseって書いてある。マジかよ)
- 2012/4 - 2014/3の期間における1分間隔の電力消費量、水消費量、天然ガス消費量データ
- 該当地域・同期間の1時間毎の天候データと、1981-2010における平均的気候データ
- 費用便益分析用のUtility企業への支払い費用データ
- 各器具の仕様書
天候データ、水消費、天然ガス消費データがきっちり付属しているのはとても親切で、オープンソースのデータセットとしては中々の充実っぷり。特に、実際の電力費用や各器具の仕様書まで公開されており、HEMSやスマートハウスのモデル検証にはかなり役立つのではないでしょうか。僕なら自分の家でこんなに頑張ってデータ取得したら有料で売りたいです。このデータに関する論文は[1]。
#【2】UK Domestic Appliance-Level Electricity (UK-DALE) dataset
UK-DALEデータセットはイギリス発。AMPds2より電力面では更に詳細な住宅のエネルギー消費のデータセットです。
- データ概要
- 現在5つの住居のデータを提供中(拡大中)。最も計測機関の長い住居は2012年から2017年までのデータを公開している。
- 基礎データは6秒おきの各機器レベルと全住居レベルの電力需要データ。
- 5住居のうち3軒では全住居レベルの電圧・電流を16kHzの粒度で計測したデータを公開(7.6TB分あるらしい...)
- 1軒はガス・電力のメーター値も提供している(が、こちらはかなり不規則かつ少数)
関連論文は[2]。圧倒的データ点数で自宅PCにダウンロードしきれないです。住宅の電力需要のみに着目する場合はこのレベルのデータを手に入れる手段はたとえ企業との共同研究であっても限られているのではないでしょうか。
#【3】ECO(Electricity Consumption and Occupancy)
ECOデータセットはスイスのETH Zurichが中心となって収集されたデータセットのようです。住宅のデータですが、電力需要の変化から住人の在宅状況を把握する研究のために蓄積されたデータだそうです。
- データ概要
- スイスの6住居に関する電力需要のデータ。
- 電力需要の計測は各機器レベルと全住居レベルで、1秒おきの8ヶ月間の電流、電圧、3相交流の位相変動のデータ。
- 特徴として、赤外レーダーと自己申告データに基づいた在宅状況に関するデータを含んでいる。
私が大学院で研究している際には、「在宅状況を知られること」が電力データセットが公開されない一番の理由なんて言われていることもありましたが、まさにそのデータを積極的に公開しているデータセットがあるというのは中々驚きです。電力会社の見守りサービスなどの研究をするには良いデータセットですね。関連論文は[3]、[4]。
#【4】GREEND
GREENDはイタリア、オーストリア発のHEMS研究用データセットです。
- データ概要
- 9住居について、1年間のデータを記録している。
- データ要素は1秒毎の機器毎、全住居の電力のみ。
- 論文にどんな人がどんなスタイルで住んでいるか書いてある
他のデータセットと比較すると少しデータ量は少ないかもしれませんが、HEMS研究用に世帯構成の異なる住居をピックアップしているため、世帯構成に関わる分析には有用かも知れません。関連論文は[5]にあります。
#【おまけ】
The Controlled On/Off Loads Library (COOLL)
COOLLはフランス発。ドライヤーや掃除機といった個別機器関連のデータセットです。こちらも論文[5]が公開されています。
- データ概要
- 12種類42機器の使用開始からの電圧、電流カーブを100kHzのサンプリング周波数で6秒間計測したデータを集めたデータセット
- 個別機器に関するデータセットの中でも高サンプリングレートであるのが売り
このデータはかなり機器分離研究寄りではありますが、論文を見たところ個別機器データに関するデータセットはこの他にも結構たくさんあるようです。
Dataport
アメリカのデータセットで、ウェブサイトを見た感じだと良質なデータが集まっていそうに見えるのですが、学生じゃないと無料ユーザー登録ができないようです。論文は[6]。
- データ概要
- 1000世帯以上の1分単位の電力消費のデータを回路レベル、建物全体レベルで蓄積したデータベース
- 米Pecan Street社によって収集されているデータで、現在も計測が続いている
#最後に
今回初めてエネルギーマネジメント関連のオープンなデータセットを調べてみましたが、上記に紹介したもの以外にも、インドやポルトガルなどでも優れたデータセットを公開している様子が伺えました。一方で、日本の企業や研究所のデータがほぼ全く見当たらず、何とも言えない気分になってしまいました。
今回色々なデータを見つけるきっかけとなったNILM Datasetは機器分離という特殊な研究コミュニティでデータの蓄積を行っているようですが、EMS関連の研究にも有用そうなデータがたくさんありました。参考文献を辿れば更にたくさんのデータセットが見つかりそうです。
もし日本の電力消費に関する高品質なオープンデータセットを知っている読者の方がいらっしゃれば、コメントなりで紹介していただけると幸いです。
国内電力業界でも有用なデータセットをオープンに公開する動きが増えてくると良いなと思うと同時に、上記のデータの一部は研究者自身が自分の生活空間から取得したデータを公開しているようなものであり、個人としてのデータセット開発も可能なのだと思い知らされました。
#参考文献
[1] Makonin, S. et al. "Electricity, water, and natural gas consumption of a residential house in Canada from 2012 to 2014". Sci. Data 3:160037 doi: 10.1038/sdata.2016.37 (2016).
[2] Jack Kelly and William Knottenbelt. "The UK-DALE dataset, domestic appliance-level electricity demand and whole-house demand from five UK homes", Scientific Data 2, Article number:150007,(2015)
[3] Wilhelm Kleiminger, Christian Beckel, Silvia Santini, "Household Occupancy Monitoring Using Electricity Meters.", Proceedings of the 2015 ACM International Joint Conference on Pervasive and Ubiquitous Computing (UbiComp 2015). Osaka, Japan, September 2015.
[4]Christian Beckel, Wilhelm Kleiminger, Romano Cicchetti, Thorsten Staake, and Silvia Santini, "The ECO Data Set and the Performance of Non-Intrusive Load Monitoring Algorithms.", Proceedings of the 1st ACM International Conference on Embedded Systems for Energy-Efficient Buildings (BuildSys 2014). Memphis, TN, USA. ACM, November 2014.
[5] A. Monacchi, D. Egarter, W. Elmenreich, S. D’Alessandro, A. M. Tonello. "GREEND: An Energy Consumption Dataset of Households in Italy and Austria." In proceedings of the 5th IEEE International Conference on Smart Grid Communications (SmartGridComm 14). November 2014, Venice, Italy.
[6] Thomas, P. et al. "COOLL: Controlled On/Off Loads Library, a Public Dataset of High-Sampled Electrical Signals for Appliance Identification"(2016)
[7] Oliver, P. et al. "Dataport and NILMTK: A Building Data SetDesigned for Non-intrusive Load Monitoring", 1st International Symposium on Signal Processing Applications in Smart Buildings at 3rd IEEE Global Conference on Signal & Information Processing(2015)