6
12

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

[R]RSeleniumの環境構築(Windows)

Last updated at Posted at 2019-03-12

ウェブスクレイピングをしてみたいと思い色々調べていると、Rにおいては、rvestRSeleniumパッケージを組み合わせてやれば良いらしい。rvestは通常のパッケージと同様に使用可能ですが、RSeleniumは環境構築が必要だったので備忘録として残しておきます。

#RSelenium
WEB UIテストの自動化ツールであるSeleniumをRから実行できるパッケージ。
ローカルで立ち上げたSeleniumサーバを通して、ウェブページを操作することができます。

##環境構築
ローカルでSeleniumを立ち上げて、Google Chromeを利用してウェブページの操作を実施する場合。
Seleniumを利用する際は、操作したいブラウザに適したドライバを、OSに合わせてこちらの配布サイトよりダウンロードしてフォルダへ格納し、パスを通しておきます。

該当のドライバをダウンロード後、[公式サイト](https://www.seleniumhq.org/download/)から最新のSeleniumのバイナリファイルをダウンロードします。先ほどダウンロードしたドライバと同じフォルダに保存しておきます。

こんな感じでフォルダに一緒に格納。

#Seleniumサーバの立ち上げ
コマンドプロンプトを開き、格納したディレクトリへ移動した上で以下のように入力すれば、seleniumサーバが立ち上がります。

java -jar selenium-server-standalone-3.141.59.jar

うまくいっていれば~Selenium Server is up and running on port 4444、といったINFOが表示されていると思います。

#Rでの使用
サーバを立ち上げた状態が整えば、Rからの各種ウェブ操作が可能になります。

#立ち上げたいページのurl
url <- "https://www.google.co.jp/"

#ブラウザを立ち上げる
rem <- remoteDriver(port=4444L,browserName = "chrome")
rem$open()

#ブラウザで目的のページに移動する場合
rem$navigate(url)

その他RSeleniumの細かい各種操作については以下の記事に非常に分かりやすくまとまっています。

#参考ページ・本

  1. 「Rによるスクレイピング入門」C&R研究所
  2. [翻訳] RSelenium vignette: RSeleniumの基本
  3. ChromeDriver - WebDriver for Chrome
  4. Windowsの環境パスを通す(path)
6
12
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
12

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?