この記事では、Rのプログラムを、RStudioなどを立ち上げることなく、バッチファイルを使って自動で実行する方法を解説します。
Rのコードを自動実行したい
- 自分がPCを使ってない時間にプログラムを実行したい。
- 毎日何度も同じプログラムを実行したい。
- 実行したいプログラムが大量にある。
実務でRを使っている人であれば、こうしたRの使い方をしたいという要望が強いのではないかと思います。でもそれはそんなに難しいことではなく、Windows環境だとちょっと設定をすれば毎日決まった時間に同じRのコードを実行できるようになります。
私自身もこの方法を使って自分の分析業務のために1日100回以上Rコードを実行しており、気が付いたら業務に必要なデータが出来上がっているという状態です。
以下で、Rの自動実行の設定について手順をまとめます。
設定の流れ
この記事では、以下の通りの手順でRを自動実行できるように設定します。
- 環境変数の設定
- 実行したいコードが書かれたRファイルの準備
- Rを実行するためのバッチファイルの準備
- タスクスケジューラで自動実行の設定
Step 1 - 環境変数の設定
自動でRを実行するためには、Rがインストールされている場所をコンピュータに教えておいてあげる必要があります。これが環境変数の設定です。
まず、左下の検索ボックスで "システム環境変数の設定" を検索してください。
結果をクリックすると下のような[システムのプロパティ]が表示されますので、"環境変数" のボタンを押してください。
環境変数の一覧が表示されるので、ユーザ環境変数の中から"Path" を選んで"編集"ボタンを押します。
下のような画面が出てくるので、"新規" ボタンを押して、Rがインストールされている場所を登録しておきましょう。私のRはProgram Filesにインストールした 4.1.1 の64bitのRを使うのでこの画像の通り設定しておきます。
OKを押して閉じると、環境変数の設定は完了です。
Rのバージョンを変更するときは、この環境変数を書き換えましょう。
Step 2 実行したいコードが書かれたRファイルの準備
Rのコードを実行したいのだから、Rのコードを準備するのは当然なのですが、一つ注意点があります。コードの中でsetwd()関数を使って作業ディレクトリを指定しておきましょう。しておかないと、どこかデフォルトのフォルダで実行されちゃいます。
なお、フォルダの区切りは \ ではなく/ なので注意しましょう。
今回実行するコードは次のようなコードです。
setwd("D:/Dropbox/データ分析/test")
library(tidyverse)
print("testです。")
A <- matrix(rnorm(100),ncol = 2)
write.csv(A,"rand_matrix.csv")
サンプルなのでなんでもいいんですが、今回は適当に何かライブラリを読み込んでみて、さらにコードが実行されたことがわかるようにcsvの出力もするコードにしてみましょう。
Step 3 Rを実行するためのバッチファイルの準備
次に、バッチファイルにRファイルを実行するコマンドを書きましょう。
"D:\Dropbox\データ分析\test\test.r" にあるRファイルを実行したいとすると、下のようになります。これだけ知っておけばいいと思います。私もこれしか知りません。
rem これはコメントです。以下のRファイルを実行します。
Rscript D:\Dropbox\データ分析\test\test.r
rem 10秒待機するコマンド。実行の確認などに。
timeout /t 10
rem 実行が終わった後コマンドプロンプトを閉じないコマンドは cmd /k です。
rem cmd /k
rem はコメントアウトです。
メモ帳に上記のコマンドを書いて、拡張子をtxtではなくcmdにして名前を付けて保存しましょう。
文字コードを指定できるので実行時に文字化けしないものを選んでください。
Step 3-2 実行してみましょう
作ったcmd ファイルをダブルクリックしてうまく実行できるか確認してみましょう。ここまでうまくできていれば、コマンドプロンプトが立ち上がって、コードが実行されるはずです。cmd ファイルの文字コードがよくないとここで、文字化けが起こります。
setwdで指定したディレクトリを見に行くと、無事にcsvが出力されたことが確認できます。
どうでしょうか。ここまでできれば、RStudioを立ち上げなくても実行したいRのコードをダブルクリックで実行できますね。
最後に、このダブルクリックを、タスクスケジューラで実行できるようにしましょう。
Step 4 タスクスケジューラの設定
左下の検索ボックスからタスクスケジューラを検索し、タスクスケジューラを立ち上げたうえで、"タスクの作成" の操作を選びます。
[全般]、[トリガー]、[操作]の3つのタブで設定が必要です。
[操作]では先ほど作成したcmdファイルを指定してください。
[トリガー]はスケジュールです。例えば平日の朝7時に実行したい場合は↓のように設定します。
[全般]には、タスクの名前を付ければOKです。わかりやすいものにしましょう。
以上で設定は終わりです。
おわりに
いかがでしょうか。一度環境変数などを設定しておけば2回目からは5分程度でスケジュール設定までできると思います。
データサイエンティストだけでなく、普通のサラリーマンとっても、データ操作をかなり便利に行うツールとしてRは有用です。一度プログラムを作ったら、2回目からの実行は完全に自動化して、業務の効率化につなげていきましょう。
終わり。