貿易統計は、一か月ごとに、集計されます。集計は速報から、HSコードという分類コードがきちんとついたデータまで何段階かあります。HSコードつきは、約一か月後に公開されます。そのデータを使い勝手のよくなるように、ひとつにまとめて、CSVにしました。
ぜひ、ダウンロードして、分析してみてください。結構面白いです。月別は、展開するとかなりの大きいです。1988-2015 だと4G 2012-2015 でも560Mです。
まとめたデータ(CSV形式、zipで圧縮、拡張子は、.csv)は、
!New 1988年から2015年まで、展開すると4Gあります
!New 2016年 1-6月+2015年一年分 kaggle で公開
2012年から2015年まで、月別(約80M)
2012年から2015年まで、年別(約9.6M)
※拡張子は、.csv がいいですね。
下記は、コードと名称の対応表です。抜けているコードが結構あります。かなりいい加減な出来だと思ってつかってください。
ちゃんとしたコード対応表は、公開してもらえる可能性があるので、あまり根性いれてつくっていません。
EUのHSコード表 あるんですが、少しDB化するのは面倒です。
国コード
HSコード 2桁
HSコード 4桁
HSコード 9桁
データをまとめる
元のデータを見てみましょう。かなり分析しずらいです。
統計一覧 から、輸出,輸入 のページに、最新のデータへのリンクがあります。
例えば、2016年4月がそのデータの一覧です。バラバラの22個のCSVデータになっています。このページには、固有のIDがふられています。上記のデータでは、000001153320 です。まずは、この ページから22個のCSVへのリンクを取得して、データを取得します。そして、22個のCSVをひとつにまとめます。
もとCSV のレイアウト
数量は、2種類あるのですが、違いはよくわかりません。
さて、4月分のデータですが、12月まで項目があります。4月の時点では、5月以降は、空白ですが、5月のデータが公開されると、4月のデータにも5月がはいります、。1年たつと、同じ年は、月は違っていても、データの内容は全部同じになります。表示としてはやや冗長な気がします。
項目 | 説明 |
---|---|
Exp or Imp | 輸出:1、輸入:2、 |
Year | 年 ex. 2016 |
HS | 9桁のHSコード |
Country | 国コード |
Unit1 | 数量単位その1 |
Unit2 | 数量単位その2 |
Quantity1-Year | 年間数量その1 |
Quantity2-Year | 年間数量その2 |
Value-Year | 年間 金額 |
Quantity1-Jan | 1月数量その1 |
Quantity2-Jan | 1月数量その2 |
Value-Jan | 1月金額 |
以下同じ
まとめたCSVのレイアウト
年と、年月 でまとめた2種類つくります、
- 年
項目 | 説明 |
---|---|
exp_imp | 輸出:1、輸入:2、 |
Year | 年 ex. 2016 |
Country | 国コード |
Unit1 | 数量単位その1 |
Unit2 | 数量単位その2 |
QY1 | 年間数量その1 |
QY2 | 年間数量2その |
VY | 年間 金額 |
hs2 | HSコード 2桁 |
hs4 | HSコード 4桁 |
hs6 | HSコード 6桁 |
hs9 | HSコード 9桁 |
- 年月
項目 | 説明 |
---|---|
exp_imp | 輸出:1、輸入:2、 |
Year | 年 ex. 2016 |
Country | 国コード |
Unit1 | 数量単位その1 |
Unit2 | 数量単位その2 |
Q1 | 数量その1 |
Q2 | 数量2その |
Value | 金額 |
month | 月 |
hs2 | HSコード 2桁 |
hs4 | HSコード 4桁 |
hs6 | HSコード 6桁 |
hs9 | HSコード 9桁 |