@taiki0305araposted at 2023-08-25

python selenium スクレイピング

Q&A

pythonでseleniumを使ってスクレイピングしています。

写真の炎願のアゲート砕屑とx1を別々で抽出する方法を知りたいです。

0 likes

2Answer

見てみると、一つの<td>タグの中に、<a>タグとして素材名を書いて、その下に（<a>タグから抜けて）個数が表記されているようですね。

僕なら、まずこの<td>タグにある素材名を全て列挙し（この場合3つ）、例えば3つと分かったら、<td>タグの個数表記3つについて<br>タグで分離させて紐づけます

1Like

@taiki0305ara
Questioner
返信ありがとうございます。

タグにある素材名を全て列挙し（この場合3つ）、例えば3つと分かったら、タグの個数表記3つについて
タグで分離させて紐づけます

ここについてもう少し詳しく教えていただくと有難いです。宜しくお願い致します。
@konbraphat51
BeautifulSoup4を使うという仮定の疑似コードですが、
for td in ???.find_all("td"): a_list = td.find_all("a") 　item_names = [] for a in a_list: item_names.append(a.アイテム名取得) td_text = td.テキスト取得 amounts = td_text.split(<br>か"\n"のどちらか適切な方)
これで最初の素材の名前はa_list[0], amounts[0]になるはずです。
久しぶりにBeautifulSoup4コードを書くので曖昧だったりしてすみませんが、ここは調べていただければと思います。
@konbraphat51
今気づきましたが、最初の回答<a>タグなどと書いていたつもりが、Qiita側にHTMLコードと勘違いされて変なことになってしまったっぽいですね。編集しました。

This answer has been deleted for violation of our Terms of Service.