正規表現の\.について
Q&A
初歩的な質問ですみません。
正規表現のなかで文字としての.(.(文字)と書きます)を表現したい時、
例えば拡張子なんかを表現したい時って"\\..+$"って書きますよね。
区切りとしては
【\】【\.】【.+】【$】ですが、
二番目の【\.】は正規表現である.を\でエスケープしているので、.(文字)として扱う。
三番目の【.+】は一文字以上の任意の文字
四番目の【$】は末尾から
ってことなので、
【\.】【.+】【$】は
【.(文字)】【任意の文字列】【末尾が】になるので
末尾の.(文字)プラス任意の文字数なので、拡張子である.aaaの部分がヒットする、ここまでは理解できます。
ですが最初の【\】はなんでついているのかがわかりません。
実際のプログラムでも、最初の【\】がないとエラーがでます。
この【\】って後ろの【\.】に含まれる\をエスケープしているのでしょうか?
簡単なことで申し訳ありませんが、教えて頂いたら幸いです。