正規表現の基礎

Posted at 2024-08-23

最近正規表現に関して学んだので、Qiitaに書いておきたいと思います✋

wikiの説明だと、「文字列の集合を一つの文字列で表現する方法の一つ」となっています。

文字列を検索、置換、検証等する際、複雑なパターンを指定するための方法
の方がわかりやすいかもしれません。

実際にこの表だけ見ても、ピンとこない方もいるかもしれないので、実際に正規表現が動くのか確認してみます。

https://rubular.com/
こちらのサイトは正規表現チェッカーの一つですが、こちらは主に Ruby 言語に基づいた、基本的な正規表現の構文は他の多くの言語と共有されています（JavaScript、Python、PHP、Java など）。

行の先頭を「あ」にするパターンを作り、「あんぱんまん」と記入すると、右側の結果にしっかり表示される。

仮に同じパターンで「カレーパンマン」と記入すると、表示されない。

めちゃくちゃ簡単な例ですが、文字列の制限ができています。

正規表現にはプログラミング言語によって変わる。

正規表現は、プログラミング言語によって、書き方が異なります。

例えば、カタカナのみの検索を記載する際、
Rubyの場合、

/[\p{katakana}　ー－&&[^ -~｡-ﾟ]]+/

Javascriptの場合

/^[ァ-ンヴー]*$/

このように言語によって正規表現の書き方が違うというのが注意です。
※サイトが多くの言語対応のため、わかりにくいかもしれないですが、、

このように正規表現は、特定の文字列のパターンにすることができます。
統一じゃないのが、なかなか大変ですが、とても便利ですし、開発時によく使われることなどあるので、ぜひ調べてみてください！