2
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

e-Statでのデータ取得とグラフ化の注意点

Last updated at Posted at 2025-11-06

1. 概要

e-Statは、日本の政府統計を一元的に閲覧できる公式ポータルサイトです。人口、GDP、物価など、様々な統計データをブラウザ上で簡単に取得できます。データ分析の基礎を学ぶ上で、信頼性の高い公的データを活用できる点が大きな魅力です。

昨今、食料品価格の高騰が続いており、特に主食である米の価格動向は家計に大きな影響を与えています。今回は、米価の小売価格データを題材に、e-Statからの時系列データ取得とグラフ化する際の注意点を備忘録としてまとめておきます。

ポイント
:exclamation: データの集計単位に注意
:bangbang: 途中で変更されていることがある

2. データ取得と注意点

2.1 対象データ

今回は、e-Statの「小売物価統計調査(動向編)」から、お米の小売価格のデータを取得します。

取得する品目:

  • 1001 うるち米(単一原料米,「コシヒカリ」)
  • 1002 うるち米(単一原料米,「コシヒカリ」以外)

お米に分類項目があることに「お米の美味しい国」を感じてしまいます:smile:

データの詳細:

データは市区別に用意されており、地域比較も可能です。特に意味はないのですが、東京都区部のデータを使用します。

APIを利用せず素朴にe-StatのWebインターフェースから直接CSVファイルをダウンロードしました。

  

ダウンロードしたCSVファイルから不要な行や列を取り除いて、次のような表にします。この記事ではtokyo_rice_price.csvというファイル名としました。

年月 コシヒカリ コシヒカリ以外
2025年9月 4879 4689
2025年8月 4949 4778
2025年7月 5036 4842
2025年6月 5072 4825
2025年5月 4970 4769
︙ 

日付が降順になっているので、逆に並び替えてからグラフにしていきます。

2.2 データをそのまま可視化してみる

まずは、ダウンロードしたデータをそのまま可視化してみましょう。Python の pandas でCSVファイルを読み込み、matplotlib でグラフを作成します。縦軸を価格(円)、横軸を年月として時系列推移を表示しました。

# 取得データは年月が降順(新→古)なので昇順へ入替
df = pd.read_csv("./data/tokyo_rice_price.csv", index_col="年月")
df = df.iloc[::-1]

plt.figure(figsize=(15,5))
plt.plot(df["コシヒカリ"])

# 横軸のメモリ間隔の調整
ax = plt.gca()
ticks = ax.get_xticks()
ax.set_xticks(ticks[::12])  # 12個おき、もう少し細かくてもいいかも
plt.xticks(rotation=75)

plt.title("そのままの状態・特別都区内コシヒカリ小売価格推移")
plt.grid()
plt.show()

ダウンロードしたデータのコシヒカリ列の数値をそのまま折れ線グラフにしたものが次のグラフです。

graph_01.png

グラフから読み取れること

  • 2000年のお米の価格は5,500円程度を示している。
  • 2002年になると、2001年の半額?
  • 「2000年頃の米価は2025年よりも高い?」ことが読み取れます。

一見すると、「2000年頃の米価は2025年よりも高かった」という結論になってしまいます。 e-Statから取得したデータをそのまま解釈すると上記のようなことが起こりえます。これは明らかに不自然:scream: 実際には2000年代初頭よりも近年の方が物価は上昇しているはず:scream::scream::scream:

何が問題?

  • 集計単位の変更
  • 2001年12月までは、10kg(1袋)が集計単位
  • 2002年1月からは、5kg(1袋)が集計単位
  • 2002年以降と整合性を保つには価格を調整する必要があるかも

調整方法の例:
素朴に単位だけを揃えるような調整例として,

  1. 2001年12月以前のデータを 1/2倍(10kg → 5kg換算)
  2. 2002年1月以降のデータを 2倍(5kg → 10kg換算)

という2種類が考えられると思います.集計単位を統一することで,とりあえず時系列データとして接続できそうです。今回は、1番目の価格を半分にする方法で調整を試みてみます。

米価に関しては2002年1月から集計単位が変更されているのですが、どのように情報を確認するのか?その方法を見ていきます:sweat_smile:

確認方法

データ取得のページで、「▼もっと見る」→「詳細」のアイコンがあるかと思います。このアイコンをクリックすると、「小売物価統計調査」の詳細が表示されます。

check_01.png

おそらく管轄のホームページURLも表示されます。小売物価統計調査は総務省なので、

URL http://www.stat.go.jp/data/kouri/index.htm

が表示されているはずです。あとはダウンロードしたデータである小売物価統計調査(動向編)から「調査の概要」を探せば調査方法や集計単位に関する資料を探すことができます。総務省統計局の統計データに関するwebページはほぼ次の画像のような見た目になっています。

  
「調査の概要」というアイコンをクリックすれば探している資料へたどり着けるはず。「調査品目及び基本銘柄」がそれっぽいかも:smile:もう少し下まで見ていくと、月ごとの詳細な表?が見えてきます。

「小売物価統計調査」については、調査品目及び基本銘柄から実際に調査した品目や調査集計単位に関する情報を知ることが可能です。次の図は月ごとの詳細な表です。

check_04.png

月ごとの表から米価が大きく変わっていた2001年と2002年を比較してみます。

2001年12月
2001年12月.png

2001年12月は10kgが集計単位となっています。

2002年11月
2002年1月.png

2002年1月は単位の列に「1袋」?となっていますが,銘柄欄に「袋入り(5kg入り)」の表記が見えます。5kgが集計単位になっていることがわかります:sweat:

「集計を変更」 のアピールかな?セルが水色で彩られ、注意喚起されていました。ささやかながら嬉しい仕様です。

公的統計では、調査手法や集計方法の変更が定期的に更新されていることがあります。データがまったくないよりは良いのですが、若干注意が必要になる点だと思います。

ポイント

  • 公的統計では、調査手法や集計方法の変更が定期的に行われるぞ!

要チェック項目
1. データの定義・単位
2. 調査方法の変更履歴
3. 接続係数の有無

2.3 集計単位の統一

2001年12月までの米価を半分にする調整を加えてみました。10kgを5kgにすると値段は半分よりも少し高い(割高になる)気がするのですが、細かいことは気にせず、1/2倍で調整します。

データフレームの年月列をindex設定しているので2000年、2001年の文字からスタートする行のみ「1/2倍」します。思いの外面倒かも。数が少ないのでcsvファイルの段階で表計算ソフト使ったほうが簡単な気もします:sweat_smile:

1/2倍する調整
df = df.astype('float64')
mask = df.index.str.startswith(('2000年', '2001年'))
df.loc[mask, :] = df.loc[mask, :] / 2

調整済みのデータであらためてグラフを描画してみます。

調整済みグラフ
plt.figure(figsize=(15,5))
plt.plot(df["コシヒカリ"])

# 横軸のメモリ間隔の調整
ax = plt.gca()
ticks = ax.get_xticks()
ax.set_xticks(ticks[::12])  # 12個おき、もう少し細かくてもいいかも
plt.xticks(rotation=75)

plt.title("調整済・特別都区内コシヒカリ小売価格推移【単位:円/5kg】")
plt.grid()
plt.show()

graph_02.png

グラフから

  • いい感じにデータの接続がなされている気がする:smile:
  • 「2003年の夏から2004年の夏!」米価が一時的に値上がりしている。

2003年〜2004年にかけての社会情勢を確認すると、米価上昇の要因いくつか浮かび上がってくるかな。

要因の検討

  • 統計の変更はない1
  • 2003年は冷夏だった!お米の作況指数が全国平均で90となっています。2
  • 米政策の転換点だった。2002年に米政策改革大綱の策定し、2004年に米政策改革大綱の実施された。あまり関係ないかも。

どうやら天候不順による米不足が要因の一つであるとわかってきました。米政策変更により、「ブランド米の自主流通拡大」も影響している可能性もありますが、詳細な影響度は、しっかりと検証しないとわかりません。

WikiPediaによると「2003年の備蓄米(1〜2年前の古米)の放出により価格上昇を10〜20%程度に抑えるられた 。」とありました。2003年の備蓄米放出は社会的な問題にはならなかったようです。当時の備蓄方式が「回転備蓄方式」とよばれる方法で、お米の保管期間が1年〜2年と短く、保管した後に主食用として販売していたことが功を奏したと考えられています。 2011年に「棚上げ備蓄方式」に変更され、保管期間も長期になったようです。

2.4 コシヒカリとそれ以外での可視化

e-Statから取得できる米価にはコシヒカリとそれ以外があるので、両方とも価格調整してグラフにしてみました。コシヒカリが500円ほど高かったのですが、近年は価格差が小さくなっているようですね。なぜだろう🤔

graph_03.png

  1. 統計的な変更ではないと思っていても、確認しちゃいますよね。

  2. 平成の米騒動は1993年です。1993年の作況指数が全国平均で74とのことです。かなり厳しい状況だったことが伺えます。

2
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?