StreamCatはデータ前処理プログラムの開発・運用プラットフォームです。データ分析の経験はあるけどプログラム開発の経験が乏しいユーザが、簡単に開発・運用できることを目指しています。
動機
この数年で品物の値上げが当たり前のように報道されるようになりました。ヒキニートの自分にとってなけなしの貯金が目減りするのは辛い。
ふと、失われた30年でどれほど物価が上がったのか(下がったのか)が気になり、軽くググったのですが得られたのは直近2〜3年の期間か、終戦直後からの期間のグラフしか得られませんでした。それならと、公開されているデータから物価推移のグラフを作ろうと思いました。
京都市物価統計データ
日本全国の消費者物価指数ではなく私が現在居住している京都市の消費者物価指数データを使うことにしました。理由は、日本経済の指標を知りたいのではなくて自分の貯金の目減りを知りたいからです。貯金は自分の生活圏で使いますしね(多分)。
得られたのは1991年から2020年までのCSVで、月ごと・品目ごとに物価指数が記録されています。物価指数は1991年(平成2年)を基準値100にした相対値のようです。
月ごとの行と年平均の行が混ざっているのに注意です、この様な正規化されてないデータが存在する限り前処理の出番は無くなりませんね。
前処理フロー
StreamCatはデータをグラフで表示する機能があります。このフローで前処理したデータを時系列のグラフにしました。
うん?
それっぽく表示できたけど何か違和感が、、
そう、矢印で示した部分に断層のような急激な変化が見て取れます。1ヶ月で物価がこんな急激に変化するとは思えないので作ったフローが誤っているのかも。
フローを遡っても原因は分かりませんでしたが元データまで辿ると分かりました。どうやら物価指数の基準年は5年ごとに変更されるみたいです。
つまり5年ごとに指数が100に振り戻されるわけです
グラフを切り貼り
知りたいのは失われた30年間の推移なので、全ての指数を1991年(平成2年)基準に補正する必要があります。ところが、各基準年の間に変換率みたいな情報が提供されてないので困ってしまいました。
仕方ないので、「基準年の変更前後の指数はたぶん同じ」というやや乱暴な前提に立って基準年の異なるデータ同士を繋ぎました
当月の物価指数(平成2年基準) = \frac{前月の物価指数(平成2年基準)}{当月の物価指数(平成7年基準)}
データを5年ごとに切り出して補正したのでフローが大きく育ち過ぎました。この程度の処理で大きくなるのはコマンドの機能粒度が小さすぎるからなのですが、現時点のStreamCatの課題ですね、何とか改良したいです。
消費税率UP?!
まだ何箇所か断崖が残ってます、ですが元データの値からしてこのグラフの通りの変化量でした。
1997年、2014年、2019年に消費税率が上がりました、①と③は増税と時期が一致するので理由がつきます。②は1年間指数が張り付いてます、元データの値も張り付いてました、欠測したのでしょうか?
なんと、この記事作っている途中にWikipediaで全国の物価指数グラフを見つけてしまいました、でもこのグラフは2015年迄ですね。
青線のCPIと比べると②の部分を除いて京都市と形は似ています、やはり②が謎だ
わかったこと
- バブル崩壊の影響で1997年からデフレが始まったとされてるが、消費増税分が寄与したためか1997〜2020年で見ると物価は上がっている
- 1991〜2020年の間に約14%物価は上がっている(消費増税分含む)
- 今の貯金でいつまで生き延びられるんだろうか・・