0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

pythonwebスクレイピング-要素を一括取得

Last updated at Posted at 2020-04-09

PythonによるWebスクレイピング〜入門編〜【業務効率化への第一歩】の9-10勉強メモ
https://www.udemy.com/course/python-scraping-beginner/
スクレイピング対象ページ(PW制限あり)
https://scraping-for-beginner.herokuapp.com/mypage

#要件: 下記テーブルの右側部分のテキスト情報を一括取得すること
image.png

F12を押し、開発ツールで確認すると右側のテキストは、すべてtdでマークアップされていることがわかる。
image.png

1. ブラウザからtdの要素を取得する。

elems_td = browser.find_elements_by_tag_name('td')

2. tdの中から要素を一つづつ取り出しvalueに入れる

tdの要素をすべて取得したelems_tdの情報を、elem_tdに入れる。

values = []
#elems_tdの中から要素を一つづつ取り出しelem_tdに入れる
for elem_td in elems_td:

##3.elem_tdの要素(text形式)を、valueに入れる。

    #elem_tdの要素(text形式)を、valueに入れる
    value = elem_td.text

##4. valueの要素をすべて、valuesのリストに追加

    #valueの要素をすべて、valuesのリストに追加
    values.append(value)

##すべてのコード

#ブラウザからtdの要素を取得
elems_td = browser.find_elements_by_tag_name('td')
values = []
#elems_tdの中から要素を一つづつ取り出しelem_tdに入れる
for elem_td in elems_td:
    #elem_tdの要素(text形式)を、valueに入れる
    value = elem_td.text
    #valueの要素をすべて、valuesのリストに追加
    values.append(value)
#valuesを打つ
values

結果

['今西 航平', '株式会社キカガク', '1994年7月15日', '千葉県', 'バスケットボール\n読書\nガジェット集め']
0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?