記号がいらない
/ * # %
など、スクレイピング・自然言語処理においては記号はいらない場合があります。
Pythonのreモジュールで一括削除をします。
import re
code_regex = re.compile('[!"#$%&\'\\\\()*+,-./:;<=>?@[\\]^_`{|}~「」〔〕“”〈〉『』【】&*・()$#@。、?!`+¥%]')
txt = input().rstrip()
cleaned_text = code_regex.sub('', txt)
print(cleaned_text)
[]
に入っている記号のどれかに一致してしたとき削除してくれるため、この中にいらない文字を入れて削除をします。
全角の記号も強引に打ち込んで闇に葬り去りましょう。