Pandasの基本的な使い方
毎回調べなくても良いように、よく使いそうな機能のメモです
DataFrame
CSV読み込み
read_csv()
メソッドを使う
import pandas as pd
df = pd.read_csv(file_path)
先頭から読み込む行を指定
引数nrows=行数
で指定
10行読み込み
df = pd.read_csv(file_path, nrows=10)
先頭から読み込む時にSkipする行を指定
引数skiprows=行数
で指定
2行Skip
df = pd.read_csv(file_path, skiprows=2)
列を指定して読み込み
usecols=xxx
で指定する
index=0,1列目を指定したい場合
df = pd.read_csv(file_path,j usecol=[0,1])
index=0,1列目を名前で指定したい場合
df = pd.read_csv(file_path,j usecol=['col_0' ,'col_1'])
ヘッダ無しであることを明示する
通常は先頭行がヘッダ行だと推測されます
df = pd.read_csv(file_path, header=None)
DataFrameの列を指定する
'col_1'列を指定
print(df['col_1'])
DataFrameの複数の列を指定する
'col_1, col_3'列を指定
print(df[['col_1', 'col_3']])
参考