データ分析の前処理とかMysqlデータベースとかに入れるときに3時間くらい戦ったので記録を残しておきます。
邪魔な奴らのご紹介
🤗
⭕
🤓
🤔
🤘
🦁
⭐
🆗
🆖
🈲
🤐
🤗
🤖
🤑
🆙
⏩
本当に邪魔です。消えてください!🤔 最後のこいつとかなんなんですか!!
消す方法1正規表現をつかう
まず最初以下のGithubを参考にして正規表現で試しました。
大体の奴らは消えたのですが、🤔 こいつとか🤓 こいつとか複数生き残ってました。
消す方法2
emojiを使う
pip install emoji --upgrade
'🤗⭕🤓🤔🤘🦁⭐🆗🆖🈲🤐🤗🤖🤑🆙⏩'こいつらを駆逐しようと思います。
それでは僕が書いたクソコードとご一緒にどぞ(@LouiS0616 さんからアドバイスを頂きました。)
import emoji
def remove_emoji(src_str):
return ''.join(c for c in src_str if c not in emoji.UNICODE_EMOJI)
emojis = '(`ヘ´) 🤗⭕🤓🤔🤘🦁⭐🆗🆖🈲🤐🤗🤖🤑🆙⏩'
print(remove_emoji(emojis))
#出力
(`ヘ´)