この記事について
東京大学出版会 統計学入門 (基礎統計学Ⅰ)
https://www.utp.or.jp/book/b300857.html
の練習問題、第3章 3.1と第12章 12.10についての記事です。
データ
自分自身ネット上にデータが見つからず苦労したので、以下からぜひダウンロードしてください。
1984年自民党得票率と持ち家比率データ :
https://github.com/shokubohcm/Introduction_to_Statistics/tree/main/Chapter3/3.1
(LDP=Liberal Democratic Party of Japan, 自民党)
解答例(3.1)
おまけに3.1の回答例を載せます。自分はJupyter環境で行いました。
このipynbファイルも上記URLにありますのでよければご利用ください。
ライブラリ
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
データ読み込み
df = pd.read_csv(r"...任意のパス\1983_LDP_Homeownership.csv")
df.head()
データ成形
d = df.iloc[0:47,[1,2]]
d.head()
散布図作成
plt.xlabel(d.columns[0])
plt.ylabel(d.columns[1])
plt.scatter(d.iloc[:, 0], d.iloc[:, 1])
plt.show()
各項目に都道府県名を付け加える
fig, ax = plt.subplots(figsize=(15,15))
df.plot(df.columns[1], df.columns[2], kind='scatter', ax=ax)
for k, v in df.iterrows():
ax.annotate(v.iloc[0], xy=(v.iloc[1], v.iloc[2]), size=12)
plt.show()
相関係数を求める
d.corr()
ご清覧いただきありがとうございました!
統計の勉強引き続き頑張ります!💪
X: https://x.com/shokubohcm
参考にさせていただいた記事:https://qiita.com/koplec78/items/9f76cf6a803a1b590049