##概要
自分がググったor使った正規表現をメモります
##文字
半角英数字等(a~z,A~Z,_,1~9)
\w
ひらがな
\p{InHiragana}
カタカナ
\p{InKatakana}
漢字(色々な書かれ方があるが、コレが完璧で全てを含む)
[\x{2E80}-\x{2FDF}々〇〻\x{3400}-\x{4DBF}\x{4E00}-\x{9FFF}\x{F900}-\x{FAFF}\x{20000}-\x{2FFFF}]
記号:!"#$%&'()*+,-./:;<=>?@[]^_`{
\p{Punct}
文字全体(半角英数字・ひらがな・カタカナ・漢字)
[\w\p{InHiragana}\p{InKatakana}\x{2E80}-\x{2FDF}々〇〻\x{3400}-\x{4DBF}\x{4E00}-\x{9FFF}\x{F900}-\x{FAFF}\x{20000}-\x{2FFFF}]
##Twitter
Twitter APIで取ってくるツイート本文の要素を取得
Twitterのハッシュタグ
(#[\w\p{InHiragana}\p{InKatakana}\x{2E80}-\x{2FDF}々〇〻\x{3400}-\x{4DBF}\x{4E00}-\x{9FFF}\x{F900}-\x{FAFF}\x{20000}-\x{2FFFF}]+)
リプに含まれるユーザー名
@[a-zA-Z0-9_\-.]{3,15}:
RTとその時に含まれるユーザー名
RT @[a-zA-Z0-9_\-.]{3,15}:
##その他
URL
(http|https)://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?
##最後に
適宜正規表現を使い次第更新していこうと思います。
##参考文献
基本的なことは全部ここに書いてある
(忘れっぽい人のための正規表現チートシート)
https://qiita.com/tossh/items/635aea9a529b9deb3038
(正規表現の基本)
https://qiita.com/sea_ship/items/7c8811b5cf37d700adc4
正規表現の組み合わせをまとめたチートシート
(よく使う正規表現はもうググりたくない!)
https://qiita.com/dongri/items/2a0a18e253eb5bf9edba
漢字について細かく書いてある
(Unicodeで「漢字」の正規表現)
http://tama-san.com/kanji-regex/