Pythonコードで、あるサイトに行って、HTMLからテキストにし、stripで余計な文字を削除して表示させたいのですが。
初めて質問をさせて頂きます。
Pythonの勉強を始めたばかりのゴリゴリ初心者なのです。
あるサイトに行って、HTMLをテキストで抜き取って
stripで余計な文字を削除して表示させたいのですが
AttributeError Traceback (most recent call last)
in
19 for t in name:
20 ret.append(t.text)
---> 21 ret.strip(t.text)
22
23 print (ret) # ['item1', 'item2', ~]
AttributeError: 'list' object has no attribute 'strip'
と以上のエラーが出てしまいます。
何とか自分なりに、ネットで調べたのですがどうしても解かりません。
どなたか、教えて頂けないでしょうか?
コードは以下の通りです。
自分で書いたコードではなく、参考にさせて頂いたコードに
ret.strip(t.text)
のみを追加したのみです。
これがなければ正常に動作します。
モジュールのインポート
import urllib.request
from bs4 import BeautifulSoup
対象のサイトURL
url = "URLサイト"
URLリソースを開く
res = urllib.request.urlopen(url)
インスタンスの作成
soup = BeautifulSoup(res, 'html.parser')
必要な要素とclass名
name = soup.find_all("div", class_="search_result")
取得したタイトル情報を出力
ret = []
for t in name:
ret.append(t.text)
ret.strip(t.text)