More than 5 years have passed since last update.

【メモ】いまさら正規表現入門

Last updated at 2019-11-11Posted at 2019-11-11

はじめに

「正規表現ってちょっと難しそうだからまた今度勉強しよう・・・」って先延ばしにしていたら３ヶ月経っていた人向けの記事です。

正規表現とは、

いくつかの文字列を１つの文字列で表現する方法

例えば、

090-0000-0000     // 電話番号
111-0000          // 郵便番号

こいつらは、

/\d{3}-\d{4}-\d{4}/
/\d{3}-\d{4}/

こう表せます。

ちなみに正規表現を英語にするとRegular Expressionで、しばしばregexや　regexpと略されるそうです。

どちらが正しいのかはこちらで議論されていて、
結果的にどちらでも良いと結論づけられています。

なお、ベストアンサーは/regexp?/ です。
?はpの有無を両方許容すると言う意味です。

~~正規表現を書くときは/(スラッシュ)で囲みます。~~

言語によるみたいです。

文末にgがある状態すなわち、
/<正規表現>/gだと全ての文章からマッチするものを全て見つける。
逆にgを付けなければはじめてマッチした時点で処理をストップする。

/<正規表現>/g?

正規表現において\dは半角数字を表します。
なので、

444 <=> /\d\d\d/
20191110 <=> /\d\d\d\d\d\d\d\d/

であり、

444 <=> /\d{3}/
20191110 <=> /\d{8}/

であり、

444, 20191110 <=> /\d{3,8}/

とも表せます.

[AB]の意味はAもしくはBと言う意味です。

America, Bmerica <=> /[AB]merica/

また[a-z]はa || b || c || ... || zと言う意味になります。[0-9]や[A-Z]についても同様です。