最近、Pythonでスクレイピングをしていて、いらないタグを指定して削除したいな〜〜〜〜と思ったらあったのでメモ
BeautifulSoupインストール
BeautifulSoupを使用するのでBeautifulSoup4をインストールします。
$ pip install beautifulsoup4
サンプル
from bs4 import BeautifulSoup
>>> marks = '<p><span class="category">Information</span><span class="bdy"><a href="https://www.sample.com/">Now <br>available!</a></span></p>'
>>> soup = BeautifulSoup(marks, 'html.parser')
>>> a_tag = soup.find("a")
>>> print(a_tag)
>>> br_tag = soup.find("a")
>>> br_tag.decompose()
>>> print(a_tag)
# 出力結果
# <a href="https://www.sample.com/">Now <br/>available!</a>
# <None></None>
参考
https://www.whyit.work/entry/2019/04/04/101538
https://qiita.com/mtskhs/items/edf7dbba9b0b0246ef8f