Python
正規表現
絵文字
機械学習
深層学習
More than 1 year has passed since last update.

データ分析の前処理とかMysqlデータベースとかに入れるときに3時間くらい戦ったので記録を残しておきます。


邪魔な奴らのご紹介

🤗



🤓

🤔

🤘

🦁



🆗

🆖

🈲

🤐

🤗

🤖

🤑

🆙

本当に邪魔です。消えてください!🤔 最後のこいつとかなんなんですか!!


消す方法1正規表現をつかう

まず最初以下のGithubを参考にして正規表現で試しました。

https://gist.github.com/silverskyvicto/73bc1fb870e0c36b4ab6e1fca7cccd24

大体の奴らは消えたのですが、🤔 こいつとか🤓 こいつとか複数生き残ってました。


消す方法2

emojiを使う

pip install emoji --upgrade

'🤗⭕🤓🤔🤘🦁⭐🆗🆖🈲🤐🤗🤖🤑🆙⏩'こいつらを駆逐しようと思います。

それでは僕が書いたクソコードとご一緒にどぞ(@LouiS0616 さんからアドバイスを頂きました。)

import emoji

def remove_emoji(src_str):
return ''.join(c for c in src_str if c not in emoji.UNICODE_EMOJI)

emojis = '(`ヘ´) 🤗⭕🤓🤔🤘🦁⭐🆗🆖🈲🤐🤗🤖🤑🆙⏩'
print(remove_emoji(emojis))

#出力
(`ヘ´)