本記事について
本記事では、正規表現を用いて文字列操作が出来るようになることを目的としています。
正規表現とは
wikiより
文字列の集合を一つの文字列で表現する方法の一つである。正則表現(せいそくひょうげん)とも呼ばれ、形式言語理論の分野では比較的こちらの訳語の方が使われる。
要するに「文字列を指定する方法」です。
##正規表現を使う理由
正規表現に用意されている多数のメタ文字を使用すると、かなり複雑なテキストと一致する表現を、比較的少ない文字数で記述できます。
正規表現を扱ってみる
C#で正規表現を扱うためのクラスはRegexクラスです
var reg = new Regex("[^az]");
string s = reg.Replace("1234iwevepauazt","");
Console.WriteLine(s);
結果aaz
var reg = new Regex("[az]");
string s = reg.Replace("1234iwevepauazt","");
Console.WriteLine(s);
結果1234iweveput
よく使われる正規表現の例
パターン | 意味 |
---|---|
@"^\d+$" | 数値と一致(半角数値、全角数値問わす) |
@"^[0-9]+$" | 数値と一致(半角数値のみ) |
@"^[0-9a-zA-Z]*$" | 0文字以上の半角英数字と一致(ブランクも可) |
@"^[0-9a-zA-Z]+$" | 1文字以上の半角英数字と一致(ブランクは不可) |
@"^[0-9]{3}-[0-9]{4}$" | 郵便番号(半角数値3桁-半角数値4桁) |
@"^[!-~]*$" | 半角英数、半角記号に一致(ブランクも可) |
その他詳しく知りたい方は正規表現言語 - クイック リファレンス
##まとめ
正規表現を使用する最大のメリットは文章処理作業の効率化を図れることです。とくに、文書ファイルを製作しているとき、一括して文字列の置換を行いたいときなどに威力を発揮します。
ぜひ正規表現を使って、効率のいい開発を行いましょう。