Python
pandas
データ分析

pandasのto_csvの出力でハマった

よく業務でpandasの.to_csvを使うが、今日はなぜか出力に不具合があったので備忘的にメモ。

sample.py
# sample.csvとして出力
df.to_csv('sample.csv', index=False)

上記の例でいつもは出力されるが、今日は出力したcsvが正しく出力されず、意図しないところで改行がされてた。
Jupyter notebook上でデータを確認したらデータの中に「\n」や「\r」が混在していた。
今回は「\n」で統一するということで

sample.py
# \rを\nにrename
df.rename('\r', '\n', regex=True)

これで無事に出力された。

ちなみに改行コードも色々種類があるらしい。

  • LF・・・UNIX系やLinux
  • CR・・・古いMacOS(バージョン9まで)
  • CR+LF・・・Windows OSなど

統一されないかな。