LoginSignup
5
4

More than 3 years have passed since last update.

【正規表現】日本語を含むURLのみを抽出する

Last updated at Posted at 2019-07-24

日本語を含むURLのみを抽出

データをDBに取り込む際の前処理などで、日本語を含むURLのみを抽出したい場合があります。

例)英数字と記号のみを許すバリデーションルールなので、日本語を含むURLのみをPunycode化したい

以下の正規表現を使えば、日本語を含むURLのみにマッチさせられます。

https?:\/\/[0-9a-zA-Z\-\.\/\?\,\#\:]*[\u3000-\u30FE\u4E00-\u9FAF\uF900-\uFA2F\uFF01-\uFFEE]+[0-9a-zA-Z\-\.\/\?\,\#\:]*

参考

5
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
4