pandasを用いたインポート処理
pd.read_csv()を使用して単純なインポート処理を行います。
import pandas as pd
df = pd.read_csv('test.csv')
ヘッダー行の指定や部分的に読込みたい場合、パラメータで指定します。
df = pd.read_csv('test.csv', header=None, nrows=5)
- header : ヘッダー行の指定。1行目がヘッダーの場合は0、ヘッダーがない場合はNoneを指定します。(デフォルト値はinfer)
- nrows : 読み込む行数の指定
さらにタブ区切り、コメント行やNA/NaNを表す自前の文字列がある場合、以下のように指定します。
df = pd.read_csv('test.tsv', sep='\t', comment='#', na_values='Nothing')
- sep : 区切り文字の指定
- comment : 行の先頭が一致する場合コメントとして無視
- na_values : 指定文字列が存在する場合NA/NaNとして読み込み