みんな大好き dplyr では、データソースとしてデータベースを扱うことができます。
この機能は非常に便利なんですが、私以外に使っている人を見たことないです。
みんな知らないだけかもしれないので、Web上で読める情報をここにまとめておきます。
まず使い始めたい人は本家 Hadley の書いた Vignette
この Vignette を日本語で解説してくれる @dichika さんの記事
あたりを読むといいと思います。
Vignette にはなぜか CASE 式の書き方が載っていないので次の記事も読むといいです。
これで基本的なやり方はわかったはずです。
あとは DB が PostgreSQL なら環境変数を使って文字化けを防いだり接続を楽にしたりできます。
使い慣れてくると、テーブルのロードがめんどくさくなったりします。そんなときはこれ。
さらに慣れてくると、Window function を使って DB 上で移動平均や first_value を計算したくなるかもしれません。
Window function についての本家の Vignette はこちらです。
@dichika さんによるまとめはこちら。
そしてついには dplyr の魔改造に手を出してしまうかもしれません。
ここまで来るとちょっとまともではないので、マネしないほうがいいです。。
私はまともではないので、上記記事で紹介した便利関数を詰め込んだパッケージを作成中です。
機能要望等ありましたらこの記事のコメントまたは issue に書き込んでください(日本語でおけ)。
Enjoy!