More than 5 years have passed since last update.

正規表現でURLの余分な文字列を除去

Python
正規表現

Posted at 2020-02-23

import re

pattern = re.compile(r"(^[^-]*-[^-]*)-[^-,]*")

with open('out.csv', encoding='utf-8') as f:
    for row in f.readlines():
        m = pattern.match(row)
        if m:
            print(m.group(1))

out.csv

https://www.abcde.com/-0w69e7e1w00-あいうえお
https://www.abcde.com/-0w69e7e9w70-かきくけこ
https://www.abcde.com/-0w08e1e0w00-さしすせそ
https://www.abcde.com/-0w69e7e1w70-たちつてと
https://www.abcde.com/-0w69e6e2w54-なにぬねの

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up