#環境
windows10
python3.9
エディタ VSCode
#pythonライブラリ [pandas]
pythonにはライブラリが複数ありますが、今回はcsvデータを読み込んで
色々と加工するときに便利なpandasライブラリを使用します。
ライブラリを使用する時には、importを使用。
これは、どの言語でもだいたい同じですね。
import pandas as pd
#csvデータを読み込んで表示してみよう!
csv読み込みは、pandasライブラリの中の「read_csv」関数を使用します。
csvのパスですが、バックスラッシュと¥記号で、躓きました。
データを読み込んだら、表示するだけです。
表示は、様々な方法があるので、以下をコピペして実行してみてください。
import pandas as pd
#msg = "Hello World"
#print(msg)
# \\や/に注意!!
# ↓↓ココにハマった
df_population_data = pd.read_csv('C:\\Users\\xxx\\py_work\\data\\data.csv',encoding='shift-jis')
df_population_data = pd.read_csv('C:/Users/xxx/py_work/data/data.csv',encoding='shift-jis')
pd.set_option('display.max_columns', 10) # 最大表示列数
pd.set_option('display.max_rows', 10) # 最大表示行数
# 全データ表示
print(df_population_data)
# 先頭10行表示
print(df_population_data.head(10))
#デフォルトは、先頭・末尾5行
print(df_population_data.head())
print(df_population_data.tail())
# 50~55行目を表示
print(df_population_data[50:55])
# 先頭行の要素を表示
print(df_population_data.iloc[0])
# 都道府県コードの表示 要素1つ目
print(df_population_data.index.values)
お試しで、全データを表示してみます。
> & C:/Users/xxx/AppData/Local/Programs/Python/Python39/python.exe c:/Users/xxx/py_work/test2.py
都道府県コード 都道府県名 元号 和暦(年) 西暦(年) 人口(総数) 人口(男) 人口(女)
0 1 北海道 大正 9.0 1920.0 2359183 1244322 1114861
1 2 青森県 大正 9.0 1920.0 756454 381293 375161
2 3 岩手県 大正 9.0 1920.0 845540 421069 424471
3 4 宮城県 大正 9.0 1920.0 961768 485309 476459
4 5 秋田県 大正 9.0 1920.0 898537 453682 444855
.. ... ... .. ... ... ... ... ...
934 43 熊本県 平成 27.0 2015.0 1786170 841046 945124
935 44 大分県 平成 27.0 2015.0 1166338 551932 614406
936 45 宮崎県 平成 27.0 2015.0 1104069 519242 584827
937 46 鹿児島県 平成 27.0 2015.0 1648177 773061 875116
938 47 沖縄県 平成 27.0 2015.0 1433566 704619 728947
#参考
こちらを参考にしました。
#感想
今まで、C,C++,Javaなどで開発をしてきましたが、csv読み込みを1行で行えるなんて!
しかもfor文を使用しなくていいなんて!!!と感動しっぱなしでした。
他のライブラリも使用してみたいと思います。