More than 5 years have passed since last update.

学び合う会 #貿易統計課題（豚肉　輸入　カナダ vs アメリカ）

Last updated at 2020-06-10Posted at 2020-03-07

豚肉輸入からわかる貿易協定の影響（すみません。記事古いです。できるだけ早く変更します。）

kaggle の学び合う会 #貿易統計　に続く個別課題です。kaggle の notebook に続けて書いてたのですが、長くて使いずらいので、qiita に切り出すようにしました。

豚肉(HS4 0203) をカナダ、アメリカで比較します。ＴＰＰでカナダが伸びましたが、アメリカも貿易協定を日本と結んだので、2020年1月は逆転しています。下記のセルで、そのデータを集計していきます。『これから先は、個別の課題を扱います』以下に下記のセルを順に作成して、実行します。

課題用の一時テーブルをつくり、計算負荷を減らします。

# 計算負荷を減らすために先に 豚肉全体(0203) 輸入(import) を年のテーブル(year_from_1997)から作成する
# 作成する一時テーブル名は、y_hs_0203_import 
# 一時テーブルがあったときは、削除するのが、次の try ～ except までです。
# 
try:
    cursor.execute('drop table y_hs_0203_import')
except:
    pass

# 条件　HS4 豚肉 hs4 = '0203' 輸入 exp_imp=2 で、year_from_1997 からデータを抽出
# 複数行にわたるので、ヒヤドキュメントという記述方法つかっています。""" から、""" までを
# sql に格納します。最後にある[1:-1]は、最初の行と最後の行を除くためです。

sql="""
create table  y_hs_0203_import
as select Year,hs9,hs6,Country,Value
from year_from_1997 
where
exp_imp=2 and
hs4 = '0203' 
"""[1:-1]
cursor.execute(sql)

年、年月の時系列で、２つの系列の比較をする関数。具体的には、アメリカとカナダの比較

# 2か国比較用の関数 sql 以下は、規定値　実際に使うときは、適宜規定値を変えてください。
def graph_c2(sql,period='Year',last_p='2019',c2=[['302','Canada','r'],['304','USA','b']]):
    # pandas というpython のデータ形式に、sql の実行結果を格納します。
    df = pd.read_sql(sql,conn) 
    #　グラフで表示がわかりやすくなるために、名前を付与
    df['name'] = ''
    # Country が数字型になっているので、変換しておきます。（データ作成のミスなんでそのうち元データ修正します）
    df['Country'] = df['Country'].astype('str')
    df.loc[df['Country'] == c2[0][0], 'name'] = c2[0][1]
    df.loc[df['Country'] == c2[1][0], 'name'] = c2[1][1]
    
    # グラフ作成
    plt.figure(figsize=(20, 10))
    
    ax = sns.lineplot(x=period,y='Value',hue='name',
                      data=df,linewidth=7.0,
                      palette={c2[0][1]: c2[0][2] ,c2[1][1]: c2[1][2]})
    # 年,年月が途中で省略されないため
    ax.xaxis.set_major_locator(ticker.MultipleLocator(1)) 
    # sql からつくられたデータフレームを返り値にします。
    return(df)

sql テンプレート

# sql 文のテンプレート　カナダ(302) アメリカ(304) を 比較　変数は、hsコードの部分 {w}がそれです。
# sql_tmpl は、同じ名前をつかいまわしているので注意が必要です。
# 最終的な表示のの指定は、規定値をつかいできるだけ簡単にするのがいいと思っての運用です。
# どういった運用がいいかは人によって判断が異なりますので、適宜変更をしてください。

sql_tmpl="""
select ym,Country,sum(Value) as Value 
from ym_2018_2020
where {w} and
exp_imp = 2 and
Country in ('302','304')
group by ym,Country
"""[1:-1]

2018/01 - 2020/01 の豚肉全体(0203) の金額ベースでのアメリカとカナダの比較をグラフで表示です。結構月による変動があります。2020/01 は、アメリカに逆転されています。

# 年月で、豚全体の比較です。USA が逆転です。
w = "hs4='0203'"
sql = sql_tmpl.format(w=w)
df = graph_c2(sql,'ym','202001')
# 次の df をコメントアウトすると,データフレームの内容表示が抑制されます。
# エクセルにコピペして使う場合は、
# df

1997-2019 の豚肉(0203)の比較　アメリカが落ちているというより、カナダが伸びている感じですね。

# 豚肉 全体を年で比較します。
sql="""
select Year,Country,sum(Value) as Value 
from y_hs_0203_import
where Country in ('302','304')
group by Year,Country
"""[1:-1]
df = graph_c2(sql)

HS4 0203 を、HS6 に分けて集計

sql="""
select hs6,sum(Value) as Value
from y_hs_0203_import
where Year = 2019
group by hs6
order by Value desc
"""[1:-1]

df = pd.read_sql(sql,conn)
# Markdown 用の出力
print(tabulate(df.head(10), tablefmt="pipe", headers="keys"))

冷凍: 020329 冷蔵: 020319 　アメリカ、カナダ以外には、冷凍が多いです。

	hs6	Value
0	020329	289447198
1	020319	214100663
2	020322	953476
3	020312	558767
4	020321	16022
5	020311	468

sql テンプレート切り替え、HSコード指定ができるようにします。

# sql 文のテンプレートを切り替えます。
sql_tmpl="""
select Year,Country,sum(Value) as Value 
from y_hs_0203_import
where {w} and
Country in ('302','304')
group by Year,Country
"""[1:-1]

冷蔵カナダは、TPP以前から伸びています。なぜでしょうか

# 冷蔵
w = "hs6 = '020319'"
sql = sql_tmpl.format(w=w)
df = graph_c2(sql)

冷凍減っています。なぜなんでしょう。

# 冷凍　減っています。
w = "hs6 = '020329'"
sql = sql_tmpl.format(w=w)
df = graph_c2(sql)

HS9 020319022 (冷蔵のHS9 で一番多い)で、カナダ、アメリカを比較

# Canada と　USA の比較 1997-2019 冷蔵のうち一番分量の多い 020319022　のグラフ
w = "hs9='020319022'"
sql = sql_tmpl.format(w=w)
df = graph_c2(sql)

豚肉の国別ランキング（2019）

# 豚肉の輸入国ランキング 2019 y_hs_0203 から、集計
sql="""
select Country,sum(Value) as Value
from y_hs_0203_import
where Year = 2019
group by Country
order by Value desc
"""[1:-1]

# 国名をつけ加えるところは、pandas 

df= pd.read_sql(sql,conn)
df['Country']=df['Country'].apply(str)
df = pd.merge(df,country_eng_df,on='Country')
print(tabulate(df.head(10), tablefmt="pipe", headers="keys"))

	Country	Value	Country_name	Area
0	304	130701952	United_States_of_America	North_America
1	302	121883537	Canada	North_America
2	218	64817019	Spain	Western_Europe
3	204	58695740	Denmark	Western_Europe
4	305	53588273	Mexico	Middle_and_South_America
5	207	17734471	Netherlands	Western_Europe
6	409	14548203	Chile	Middle_and_South_America
7	213	13747683	Germany	Western_Europe
8	210	8453213	France	Western_Europe
9	220	6686972	Italy	Western_Europe

まとめ　

TPPで、カナダは日本市場でシェアを取りました。これからは、アメリカがどのくらいもりかえせるか？
冷凍肉のスペインも今後のびそうですね。デンマーク、メキシコもスペインと横並びといってよいです。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

学び合う会 #貿易統計 課題（豚肉 輸入 カナダ vs アメリカ）