この記事について
データ分析を勉強していくうちに、正規表現を理解しないといけない状況がどんどん出てきます。人のコードを読むときとか、データクリーニングのとき。。。などなど。
2つの資料を使って、二日ぐらい勉強したら、下記みたいなよく使うやつは意外と書けるようなったので、勉強した資料を記事にまとめたいと思います。
"https?://(?:www.)?([a-zA-Z0-9\-_]+(?:\.[a-zA-Z0-9\-]+)+)"
HackerRank で練習する
HackerRank Introduction Challenges
正規表現は正確にいうと、言語の一種です。
だから、使わないと勉強できない。
このサイトなら、本当に基礎ゼロから練習できるからオススメ。
Python 3 の公式サイト
少し (二、三問でも大丈夫) HackerRank で練習したら、多分お題とチュートリアルを読んでもよくわからないやつがどんどん出てきてるので、その時は Python 3 の公式ドキュメント を開きましょう。
これを全部読むと正規表現の文法を理解できる。でも、いまは全文を読む必要はありません。我慢できなくなるまで読んでください。そしてまた HackerRankに切り替えて練習しましょう。
結論
HackerRankと公式ドキュメントを切り替えてやっていくとHackerRankのお題をすぐに全部解けるようになる。そして、これでほとんどの正規表現は読めるようになるはず!
もっと練習したいなら、Pythonのコースのなかでも正規表現のお題があります!でもこちらの方がPythonの特有のメソッドへの理解が必要かも。