24
36

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

Raspberry Piによるスクレイピング 環境構築(Selenium + Chromiumドライバ)

Posted at

はじめに

本記事は、Raspberry PiにSelenium + Chromiumドライバのスクレイピング環境を構築するための記事です。

静的なhtmlコンテンツを取得するurllibは、JavaScriptなどの動的なページに対応していません。そこで、SeleniumでWebブラウザを操作することで、動的なページに対するスクレイピングができます。また、Seleniumは、Google Chrome、Firefox、IE、Opera等複数のWebブラウザに対応しています。

環境

Raspberry Pi(※1) + Selenium + Chromium

Linux用のChromeドライバだと、プラットフォームが違うので対応していないため、Chromiumドライバを使用します。Chromiumドライバはこちらよりダウンロード可能です。

なお、最新のChromiumドライバのchromium-chromedriver 65(※2)では動作しないため、古いバージョンであるchromium-chromedriver 61をインストールします。

(※1)Raspbian GNU/Linux 9.3 (stretch)
(※2)本記事執筆時点

構築手順

  1. Seleniumをインストールする
    $ pip3 install selenium

  2. Seleniumのインストール確認
    $ pip3 list | grep selenium

  3. debパッケージをインストールする
    $ sudo dpkg -i chromium-chromedriver_61.0.3163.79-0ubuntu0.14.04.1196_armhf.deb

  4. Chromiumドライバのインストール確認
    $ ls -l /usr/lib/chromium-browser/chromedriver

動作確認

  • 動作確認プログラム
#! /usr/bin/env python3
# -*- coding: utf-8 -*-

import sys
sys.path.append('/home/pi/.local/lib/python3.5/site-packages/')
from selenium import webdriver

browser = webdriver.Chrome(executable_path="/usr/lib/chromium-browser/chromedriver")
browser.get('https://www.google.com/')
  • 動作確認
    スクリーンショット 2018-08-30 00.09.44.png

Raspberry PiにVNCでログインしてプログラムを実行すると、Webブラウザ(Chrome)が起動し指定したページを開きます。

24
36
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
24
36

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?