WEBサイトのデータ取得

Posted at 2024-02-09

WEBサイトのデータ取得

はじめに

スクレイピングで遊んでいた時に便利だなと思ったことをメモとして書き残しときます。

find_next_sibling()

find_next_sibling() メソッドは、指定した要素の直後にある兄弟要素（同じ親要素を持つ要素）を取得します。

from bs4 import BeautifulSoup

html = """
<div class="container">
    <p>First paragraph</p>
    <p>Second paragraph</p>
    <p>Third paragraph</p>
</div>
"""

soup = BeautifulSoup(html, 'html.parser')

# 最初の <p> 要素を取得
first_paragraph = soup.find('p')

# 最初の <p> 要素の次にある兄弟 <p> 要素を取得
second_paragraph = first_paragraph.find_next_sibling('p')

print(first_paragraph.text)  # 出力: First paragraph
print(second_paragraph.text) # 出力: Second paragraph

最初の<p>要素を取得し、その次にある兄弟要素である2番目の<p>要素を取得しています。この場合、最初の<p>要素の次にある兄弟要素は "Second paragraph" です。

これで特定の要素の次の要素が取得できます。可変的なものでidやclassから取得できない時に便利なので覚えておくといいことあるかも。

記事を読んでくださった方は、是非弊社開発課のXもフォローしてね
毎日エンジニアに向けた情報発信を行っています
https://twitter.com/tech_cin

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up