LoginSignup
0
0

More than 1 year has passed since last update.

pandas.read_csvでUnicodeDecodeErrorが出るときの対処法

Last updated at Posted at 2022-06-19

現象

import pandas as pd

df = pd.read_csv('read.csv')
print(df)

read.csvに日本語が含まれている場合に上記のコードを実行すると、

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x92 in position **: invalid start byte

というエラーが発生する。

こういう時はエラーをちゃんと読むのが大切。

デコードできないよって言われてるようですね。

解決策

エンコードを指定する。 windowsで書かれたものはcp932を指定すればいいっぽい。
import pandas as pd

df = pd.read_csv('read_csv', encoding="cp932")
print(df)
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0