使用するExcelファイル
以下の内容でtest.xlsファイルを作成します。
PythonでExcelを読み込む
以下pandasを使用してExcelファイルを読み込みます。(ExcelFileではxlsxファイルは現時点サポートされません。)
シート名を取得します。
import pandas as pd
xls_data = pd.ExcelFile('test.xls')
print(xls_data.sheet_names)
出力:
['Sheet1', 'Sheet2']
各シートの内容を読み込みます。インデックスもしくはシート名で対象シートを指定します。
df1 = xls_data.parse(0)
print(df1.head())
df2 = xls_data.parse('Sheet2')
print(df2.head())
出力:
col1 col2 col3
0 1 value1 value1
1 2 value2 value2
2 3 value3 value3
列1 列2
0 1 値1
1 2 値2
2 3 値3
読込みオプション
以下のようにオプションを使用しての読込みも可能です。
# 1行目スキップ、カラム名のリネーム
df1 = xls_data.parse(0, skiprows=[0], names=['Index','Value01', 'Value02'])
print(df1.head())
# 1列目指定、1行目スキップ、カラム名のリネーム
df2 = xls_data.parse('Sheet2', usecols=[0], skiprows=[0], names=['インデックス'])
print(df2.head())
出力:
Index Value01 Value02
0 2 value2 value2
1 3 value3 value3
インデックス
0 2
1 3