正規表現とは端的に言うと、**「いくつかの文字列を一つの形式で表現するための表現方法」
**です。
####メタ文字
「正規表現」には「メタ文字」と呼ばれる特殊な文字があります。この「メタ文字」を使って、複数の文字列をまとめて表現できます。
####メタ文字の種類
#####文字の種類
どの「文字の種類」が使われているかを指定するメタ文字です。
メタ文字 | 意味 | 備考 |
---|---|---|
. | すべての文字 | 改行は除く |
[125] | 1,2,3のどれか | |
[0-9] | 数字 | [0123456789] と同じ |
[a-z] | アルファベット小文字 | |
[A-Z] | アルファベット大文字 | 大文字と小文字を区別しない方法もある |
[0-9a-z] | 数字またはアルファベット小文字 | |
[^0-9] | 0~9以外の文字 | ^はいわゆる論理演算の否定「not」 |
[ぁ-ん] | ひらがな | |
ァ-ヴ | カタカナ | |
[ヲ-°] | 半角カタカナ | 最後は半角の半濁音「° 」 |
#####繰り返し
文字の「繰り返し」を指定するメタ文字です。
メタ文字 | 意味 | 備考 |
---|---|---|
* | 0回以上繰り返す | +との違いを使い分けよう |
+ | 1回以上繰り返す | *との違いを使い分けよう |
? | 0回または1回 | |
{5} | 5回繰り返す | |
{5,} | 5回以上繰り返す | |
{5,9} | 5回以上9回以下繰り返す |
#####位置(先頭・末尾など)
文字列がどの「位置」にあるかを指定するメタ文字です。
メタ文字 | 意味 | 備考 |
---|---|---|
^ | 先頭 | []内では否定の意味になるので注意 |
$ | 末尾 | |
¥b | 単語境界 | 単語の末尾や先頭のこと |
¥B | 単語境界以外のこと |
####まとめ
正規表現に関するすべての知識をカバーしたわけではありませんが、
今回紹介したメタ文字については、比較的簡単で使いやすいものです。他にもエスケープ文字や選択文字、キャプチャなど種類が多くあります。
メタ文字について詳しくまとめてある参考記事はこちらになります。
(https://at.sachi-web.com/blog-entry-1150.html)