Webスクレイピングでデータ取得していたときに、エラーが発生したのでメモ
Windowsではファイル名として無効文字\/:*?"<>|
があるのでそれを削除する
re.sub(pattern, repl, string)
文字列置換にはreplace()
があるが、正規表現で処理できないのでre.sub()
を用いる
使い方は、re.sub('置換対象文字','置換文字','入力文字列')
re.sub
import re
string='\gbahsd:njs?<>|"asd/as*'
print(re.sub(r'[\\/:*?"<>|]+','',string)
output
'gbahsdnjsasdas'
以上