@taiki0305ara

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

python selenium スクレイピング

解決したいこと

pythonでseleniumを使ってスクレイピングしています。

写真の炎願のアゲート砕屑とx1を別々で抽出する方法を知りたいです。

発生している問題・エラースクリーンショット 2023-08-25 221754.png

リンク
https://gamewith.jp/genshin/article/show/230381

0 likes

2Answer

image.png
見てみると、一つの<td>タグの中に、<a>タグとして素材名を書いて、その下に(<a>タグから抜けて)個数が表記されているようですね。

僕なら、まずこの<td>タグにある素材名を全て列挙し(この場合3つ)、例えば3つと分かったら、<td>タグの個数表記3つについて<br>タグで分離させて紐づけます

1Like

Comments

  1. @taiki0305ara

    Questioner

    返信ありがとうございます。

    タグにある素材名を全て列挙し(この場合3つ)、例えば3つと分かったら、タグの個数表記3つについて
    タグで分離させて紐づけます

    ここについてもう少し詳しく教えていただくと有難いです。宜しくお願い致します。

  2. BeautifulSoup4を使うという仮定の疑似コードですが、

    for td in ???.find_all("td"):
      a_list = td.find_all("a")
      
     item_names = []
      for a in a_list:
        item_names.append(a.アイテム名取得)
    
      td_text = td.テキスト取得
      amounts = td_text.split(<br>か"\n"のどちらか適切な方)
      
    

    これで最初の素材の名前はa_list[0], amounts[0]になるはずです。
    久しぶりにBeautifulSoup4コードを書くので曖昧だったりしてすみませんが、ここは調べていただければと思います。

  3. 今気づきましたが、最初の回答<a>タグなどと書いていたつもりが、Qiita側にHTMLコードと勘違いされて変なことになってしまったっぽいですね。編集しました。

This answer has been deleted for violation of our Terms of Service.

Your answer might help someone💌