More than 3 years have passed since last update.

Python Pandas基礎② -Excel・CSVの読み込み-

Last updated at 2022-10-10Posted at 2022-09-28

初めに

pythonのpandasについて初学者なりにまとめたいと思います。
学習に使っているのはこちらのキノコードです。

CSVファイル

読み込み

使用するCSVファイル
出典：政府統計の総合窓口(e-Stat)
「男女別人口－全国，都道府県（大正９年～平成27年）」（総務省）を加工して作成

csvファイルをデータフレームとして読み込むには、read_csv関数を使用します。
read_csv関数の引数に、読み込みたいcsvファイルのパスを指定します。
続いて、引数encodingに文字コードを渡すことで、ファイルを読み込む際の文字コードを指定することができます。
CSVファイルと同じ階層にPythonファイルを配置することでパスを省略できます。

head/tail

haed()メソッドで行頭から何行表示させるか指定できます。省略するとデフォルトの５行になります。
tail()メソッドは逆に行末から何行表示させるか指定できます。

indexを指定して読み込む

read_csv()にindex_col="インデックスに指定したいカラム"で任意の列をインデックスに指定することができます。

Excelファイル

読み込み

先ほどのCSVをExcelにコピペしたものを準備して行います。
Excelファイルをデータフレームとして読み込むには、read_excel関数を使用します。
read_excel関数の引数に、読み込みたいExcelファイルのパスを指定します。
Excelファイルと同じ階層にPythonファイルを配置することでパスを省略できます。