1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

Scrapyでformを送信する際にJavaScriptを回避する

Last updated at Posted at 2019-07-28

問題

  • Scpapy は JavaScript で生成されたコンテンツにアクセスできないため、例えば、確認のために表示されるアラートウィンドウの「OK」をクリックして先に進む、などができないことがある。

根本的な解決策

  • JavaScriptを制御できるSeleniumなどを併用する。
    • (参考記事)StackOverflow
      • ScrapyとSeleniumを併用するサンプルコードもある

簡単な解決策(条件付き)

  • 場合によっては もっと簡単に解決できる。
  • 以下のform送信ボタンのように、onclick 処理でJavaScriptのイベントが発動している場合には、scrapyの機能で回避できる。
<input type="submit" onclick="return confirm('確定していいですか?')" name="submit" value="確定" class="button">
  • クラスオブジェクト scrapy.FormRequest.from_response のパラメータ dont_clickTrue に指定することで、送信ボタンのクリックを省略して form を送信できる。これを利用すれば、onclick によって発動するイベントを回避して form が送信される。
    def submit_form(self, response):
        yield scrapy.FormRequest.from_response(
            response,
            formcss = 'table#table1 > tr:nth-child(1) > td.value > form',
            formdata = dict( decision = '1' ),
            dont_click = True
        )

〜おしまい〜

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?