正規表現の基礎
書き方 | 意味 |
---|---|
\d | 1個の半角数字(0123456789) |
{n,m} | 直前の文字が n 個以上、m 個以下 |
{n} | 直前の文字がちょうど n 文字 |
{n,m} | 直前の文字が n 個以上、m 個以下 |
[AB] | AまたはBのいずれか1文字 |
[ABC] | AまたはBまたはCのいずれか1文字 |
[a-z] | 文字の範囲。aからzという意味 |
? | または無し |
. | 任意の一文字 |
+ | 直前の文字が 1文字以上 |
* | 直前の文字が0文字以上 |
( ) | その部分がキャプチャ(捕捉)され、連番が付けられる |
(ABC)? | 文字列 ABC があり、または無し |
?: | キャプチャする必要がない ( ) は (?: ) |
\w | \w = [a-zA-Z0-9_](半角英数字とアンダースコア1文字)と同じ意味 |
*? や +? | 最短マッチを返す |
^ | 「行頭」を表すメタ文字 |
^ | 否定の意味。[^AB] であれば「AでもなくBでもない任意の1文字」(使う場所による) |
$ | 「行末」を意味するメタ文字 |
\t | タブ文字 |
\s | 空白文字全般 \s = [ \t\r\n\f] |
ABC|DEF のように書くと、「文字列ABC、または文字列DEF」という OR条件 の意味
^は使い方に注意が必要
[^AB] のような使い方をするときは「AでもなくBでもない文字1文字」
[AB^]とすると「AまたはBまたは^のいずれか1文字」
^. にすれば「行頭にくる任意の1文字」
"^" という文字だけを検索したい場合は ^