環境について
pandas== 1.1.4
xlrd==2.0.1
エラーについて
pandasでExcelファイル(xlsx)を読み込む時に
import pandas as pd
df = pd.read_excel('sample.xlsx')
下記のエラーが発生する.
xlrd.biffh.XLRDError: Excel xlsx file; not supported
原因
Excelファイルを読み取るライブラリであるxlrdが2.0.0からxlsxファイルに対応しなくなったため.
https://xlrd.readthedocs.io/en/latest/changes.html
解決方法
2つの解決方法があります.
1.xlrdのバージョンを下げる
pip3 install xlrd==1.2.0
2.ファイルを読み取るライブラリをopenpyxlに変更する
pipでopenpyxlをインストールする.
pip3 install openpyxl
Excel読み取り時にライブラリを指定する.
df = pd.read_excel('sample.xlsx',engine="openpyxl")