search
LoginSignup
20

More than 3 years have passed since last update.

posted at

updated at

Webスクレイピング初心者はPythonでChrome起動から実践するのがオススメ

はじめに

PythonでWebスクレイピングをやってみたい初心者向けの記事です。
私はここからスタートして、Webスクレイピング、Webクロールの世界にのめり込んでいきました。

環境

  • MacOS High Sierra
  • Python 3.7.1
  • Chromedriver 2.45(2018/12/26時点で最新のもの)

本記事を書いている時点ではMacユーザーですが、Windows7や10でも同じ流れです。

PythonでChromeを起動する方法

ドライバをインストールする

以下からダウンロードできます。
※Google検索で「chromedriver download」と検索してもOKです。
http://chromedriver.chromium.org/downloads

「Latest Release: ChromeDriver 2.XX」のようなリンクがあるので、各自のOSに合わせてファイルをダウンロード(zipファイル)してください。

ダウンロードしたzipファイルを解凍すれば、ドライバの取得は完了です。

Macの場合、ドライバのファイル名は、chromedriverです。
Windowsの場合、ドライバのファイル名は、chromedriver.exeです。

seleniumをインストールする

本環境のMacの場合

pip3 install selenium

Windowsの場合

pip install selenium

Pythonファイルと同じフォルダにchromedriverを置く

上記でダウンロードしたchromedriverを、Pythonファイルと同じフォルダ階層に置いてください。

※chromedriverを置くフォルダを固定したい場合は、PATHを通すやり方もあるようです。

Pythonファイル実行

Macの場合、ターミナルからPythonファイルがあるフォルダに移動して以下のコマンドで実行します。

$ python3 start_chrome.py
start_chrome.py
import time
from selenium import webdriver

# chromedriverのPATHを指定(本ファイルと同じフォルダの場合)
driver_path = './chromedriver' 

# Windows
# driver_path = r'./chromedriver.exe'

# Chrome起動
driver = webdriver.Chrome(driver_path)

# Googleにアクセス
driver.get('https://www.google.com/')

# 3秒待つ
time.sleep (3)

# Chromeを終了
driver.quit()

結果

Chromeが起動して、Googleにアクセスできれば成功です!

お疲れ様でした。
今後もWebスクレイピングLIFEを楽しみましょう!

参考

以下を参考にさせていただきました。
Python + Selenium で Chrome の自動操作を一通り

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
What you can do with signing up
20