【正規表現】Unicode 単語境界アサーション\b

Posted at 2025-09-27

正規表現の単語境界アサーション\bについてまとめた。

`\b`

単語と非単語の境目にマッチする。

「左が単語の一部でない」かつ「右が単語の一部である」位置もしくは、
「左が単語の一部である」かつ「右が単語の一部でない」位置にマッチする。

後で説明する\b{start}と\b{end}を合わせたもの。

\<と同じ。

単語と非単語の境目の、単語の頭側の位置にマッチする。

「左が単語の一部でない」かつ「右が単語の一部である」位置にマッチする。

-は単語の一部とは判定されないため、r"\b{start}-"は何にもマッチしない

「左が単語の一部でない」位置にマッチする。

右が単語の一部であるかどうかは判定しない。

-は単語の一部とは判定されないが、\b{start-half}は「左が単語でない」であればマッチするので、r"\b{start}-"が機能する。

\>と同じ

単語と非単語の境目の、単語のお尻側の位置にマッチする。

「右が単語の一部でない」かつ「左が単語の一部である」位置にマッチする。

\b{start}の逆なので例省略。

「右が単語の一部でない」位置にマッチする。

左が単語の一部であるかどうかは判定しない。

\b{start-half}の逆なので例省略。