pandasでCSVファイルの読み込み
pandasのread_csv関数のパラメタがfilepath_or_bufferとなっていたので、
CSVファイルではなくbufferを利用する方法をメモしておく。
ファイルを利用する
よく事例が転がっているタイプ。
CSVファイルからDataFrameに読み込む
import pandas as pd
df = pd.read_csv("in.csv")
DataFrameをCSV形式でファイルに書き込む
df.to_csv("out.csv")
バッファを利用する
バッファを活用するパターンは事例がすぐにみつからない。
バッファからDataFrameに読み込む
import io
import pandas as pd
data = 'AAA,BBB\n1,2\n3,4'
df = pd.read_csv(io.StringIO(data))
DataFrameをCSV形式でバッファに書き込む
buffer = io.StringIO()
df.to_csv(buffer, index=False) # indexを指定しないと行番号が出力される
print(buffer.getvalue()) # バッファの参照
実行結果
AAA,BBB
1,2
3,4
参考
pandas 0.24.2 documentation » API Reference » Input/Output » read_csv