以下のような連続するファイル名を持つCVSファイルがあるとする:
- brabra_01.csv
- brabra_02.csv
- brabra_03.csv
- (...)
- brabra_47.csv
元ファイルの文字コードがShift-JISで、これらをUTF-8に一括変換する。さらにファイルの連続番号のゼロ詰めをなくし、以下のようにリネームする:
- brabra_1_utf.csv
- brabra_2_utf.csv
- brabra_3_utf.csv
- (...)
- brabra_47_utf.csv
コードは以下の通り。
ChangeShiftJIS2utf8.ipynb
import csv
import codecs
a = 47
for i in range(a):
pref = i + 1
path = "c:/*****/brabra_%02.f.csv"%pref
path_utf = "C:/****/brabra_%01.f_utf.csv"%pref
fin = codecs.open(path, "r", "shift_jis")
fout_utf = codecs.open(path_utf, "w", "utf-8")
for row in fin:
fout_utf.write(row)
fin.close()
fout_utf.close()