#はじめに
PythonでWebスクレイピングをやってみたい初心者向けの記事です。
私はここからスタートして、Webスクレイピング、Webクロールの世界にのめり込んでいきました。
#環境
- MacOS High Sierra
- Python 3.7.1
- Chromedriver 2.45(2018/12/26時点で最新のもの)
本記事を書いている時点ではMacユーザーですが、Windows7や10でも同じ流れです。
PythonでChromeを起動する方法
ドライバをインストールする
以下からダウンロードできます。
※Google検索で「chromedriver download」と検索してもOKです。
http://chromedriver.chromium.org/downloads
「Latest Release: ChromeDriver 2.XX」のようなリンクがあるので、各自のOSに合わせてファイルをダウンロード(zipファイル)してください。
ダウンロードしたzipファイルを解凍すれば、ドライバの取得は完了です。
Macの場合、ドライバのファイル名は、chromedriverです。
Windowsの場合、ドライバのファイル名は、chromedriver.exeです。
seleniumをインストールする
本環境のMacの場合
pip3 install selenium
Windowsの場合
pip install selenium
##Pythonファイルと同じフォルダにchromedriverを置く
上記でダウンロードしたchromedriverを、Pythonファイルと同じフォルダ階層に置いてください。
※chromedriverを置くフォルダを固定したい場合は、PATHを通すやり方もあるようです。
##Pythonファイル実行
Macの場合、ターミナルからPythonファイルがあるフォルダに移動して以下のコマンドで実行します。
$ python3 start_chrome.py
import time
from selenium import webdriver
# chromedriverのPATHを指定(本ファイルと同じフォルダの場合)
driver_path = './chromedriver'
# Windows
# driver_path = r'./chromedriver.exe'
# Chrome起動
driver = webdriver.Chrome(driver_path)
# Googleにアクセス
driver.get('https://www.google.com/')
# 3秒待つ
time.sleep (3)
# Chromeを終了
driver.quit()
#結果
Chromeが起動して、Googleにアクセスできれば成功です!
お疲れ様でした。
今後もWebスクレイピングLIFEを楽しみましょう!
#参考
以下を参考にさせていただきました。
Python + Selenium で Chrome の自動操作を一通り