#動作環境
python-2.7.4
windows7
#方法
test.py
#coding:utf-8
#pandasをpdとしてインポート
import pandas as pd
#読み込むエクセルファイルのパス
input_path = "input.xlsx"
#書き込むエクセルファイルのパス
output_path = "output.xlsx"
#pandasでエクセルファイルをデータフレーム型で読み取る
data = pd.read_excel(data_path, sheetname = 'Sheet1')
#指定行だけを選定(文字列一致の場合)
specified_line_data = data.where(data.Result.str.contains("文字列")).dropna(axis=0)
#指定行だけを選定(数値一致の場合はこちら)
#specified_line_data = data.where(data.Result == 数字).dropna(axis=0)
#pandasのモジュールであるExcelWriterを使用してエクセルに書き込む形式にする
writer = pd.ExcelWriter(output_path)
#エクセルファイルに書き込み
specified_line_data.to_excel(writer, sheet_name = 'output_data')
#書き込んだ情報を保存する
writer.save()
今回は、読み込みデータから指定行だけを別のエクセルファイルに書き込む方法をやってきました。
(具体的には、Result列の文字列が(”文字列”)に一致するものだけを抽出する)
(pandasでファイルを読み込むときは先頭行がヘッダーとして認識されてしまうことに注意しましょう。今回は、読み込みファイルの先頭行にはヘッダー情報(Test,Label,Result,Score,Class,Morpheme)を記載していたため、プログラム上でのヘッダー処理は行っていません。)