#正規表現によるスクレイピング
「Python クローリング&スクレイピング」という本を読んでいて詰まってしまい解決した時の方法を載せます。
p49 リスト2.11
このまま打ち込むと
①UnicodeDecodeError: 'cp932' codec can't decode byte 0xef in position 130: illegal multibyte sequence
①を解決しても
②AttributeError: 'NoneType' object has no attribute 'group'
というエラーが帰ってきてしまう。
- ①の解決方法
openメソッドにencoding=utf-8を追加 - ②の解決方法
4つある「title =」 をtry: except: で囲みexcept:の中身はtitle = None とする。
これでURLと書籍のタイトルが取得できるはず。