LoginSignup
74
45

More than 5 years have passed since last update.

pythonで絵文字を駆逐する

Last updated at Posted at 2017-12-12

データ分析の前処理とかMysqlデータベースとかに入れるときに3時間くらい戦ったので記録を残しておきます。

邪魔な奴らのご紹介

🤗

🤓
🤔
🤘
🦁

🆗
🆖
🈲
🤐
🤗
🤖
🤑
🆙

本当に邪魔です。消えてください!🤔 最後のこいつとかなんなんですか!!

消す方法1正規表現をつかう

まず最初以下のGithubを参考にして正規表現で試しました。

大体の奴らは消えたのですが、🤔 こいつとか🤓 こいつとか複数生き残ってました。

消す方法2

emojiを使う

pip install emoji --upgrade

'🤗⭕🤓🤔🤘🦁⭐🆗🆖🈲🤐🤗🤖🤑🆙⏩'こいつらを駆逐しようと思います。

それでは僕が書いたクソコードとご一緒にどぞ(@LouiS0616 さんからアドバイスを頂きました。)

import emoji

def remove_emoji(src_str):
    return ''.join(c for c in src_str if c not in emoji.UNICODE_EMOJI)

emojis = '(`ヘ´) 🤗⭕🤓🤔🤘🦁⭐🆗🆖🈲🤐🤗🤖🤑🆙⏩'
print(remove_emoji(emojis))

#出力
(´)
74
45
6

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
74
45