More than 3 years have passed since last update.

Python - pandasライブラリを使ってCSVファイルを読み込む - 初級編

Last updated at 2022-02-18Posted at 2022-02-18

Pythonには超絶便利なライブラリがたくさん。

今回は、Pandasライブラリを使ったCSV読み込み手順をご説明。
infoは除いたけど、とりあえず最低限これが使えれば、
ファイル読み込み処理の初歩はできますね👌

1. ライブラリのインストール（入っていなければ）

以下を実行。

# x.x.xはインストールするバージョン
mamba install pandas==x.x.x -y 
# x.x.xはインストールするバージョン
mamba install numpy=x.x.x -y

import pandas as pds
import numpy as np

csvファイルを読み込むには、read_csvを使います。
pandas.read_csv(ファイルパス, option)で呼び出します。

import pandas as pds

file_path = "https://people.sc.fsu.edu/~jburkardt/data/csv/cities.csv"
d_frame = pds.read_csv(file_path, header=None)

d_frame.head(5) #先頭からヘッダを除いて5行を取得できる

d_frame.tail(5) #末尾から5行を取得できる

headers = ["LatD", "LatM", "LatS", "NS", "LonD", "LonM", "LonS", "EW", "City", "State"]
d_frame.columns = headers #先頭にヘッダが出力される

d_frame2 = d_frame.replace('?', np.NaN) #"?"の値は、NaNに置き換える
d_frame = d_frame2.dropna(subset["price"], axis=0) #Price=NaNのデータを除外する

d_frame.columns

d_frame.to_csv("xxx.csv", index=False)

d_frame.dtypes

d_frame.describe()

d_frame.describe(include = "all")

# json
pds.read_json()
pds.to_json()

# excel
pds.read_excel()
pds.to_excel()

# hdf
pds.read_hdf()
pds.to_hdf()

# sql
pds.read_sql()
pds.to_sql()