@ppapppap (python id)posted at 2021-06-27

python　id名をスクレイピング

Q&A

Closed

解決したいこと

初めて質問させて頂きます。
pythonでスクレイピングをしています。
次のようなhtmlの中から10436716(3行目)を抽出したいです。
findやfind_allで検索しても''で返ってきます。
解決方法を教えて頂けますでしょうか。
開発環境　mac anaconda

html

＜tbody class="tbody_match＞
＜tr class="" data-c1="0" data-c2="0" data-c3="0" data-ish="1" data-league_id="11818" data-match_id="104364716"
＜td＞＜img class="nation-flag" ＞src="//static.totalcorner.com/img/countries/Unknown.png"/＞＜/td＞
＜td class="text-center td_league"＞
＜tbody class="tbody_match"＞

自分で試したこと

・全てのhtmlを取得して文字列に変換
・'data-match_id'を検索してその後の文字列を指定して抽出
上記をループしようとしましたが、同じところをループしてしまいうまくいきませんでした。

ソースコード

res = requests.get(url)
time.sleep(2)
soup = BeautifulSoup(res.text,"html.parser")
time.sleep(2)

game_data=soup.find_all('tbody')
game_data

data=[]
while not game_id =='':
game_id=str(game_data).find('data-match_id')
r = str(game_data)[game_id+len('data-match_id'):]
r[2:10]
data.append(r)

0 likes

Are you sure you want to delete the question?

python　id名をスクレイピング

解決したいこと

html

自分で試したこと

ソースコード

1Answer

Comments

Your answer might help someone💌

python id名をスクレイピング

解決したいこと

html

自分で試したこと

ソースコード

1Answer

Comments