前回は、dashDBの管理画面を利用してSQLを発行する方法を試してみました。Web画面を利用しているのでなんだかまどろっこしいですが、まぁ、普通に利用できます。本格的に利用するのであれば外部から接続した方がいいかとは思いますが、クラウドの特徴を活かす意味ではWebブラウザだけで操作できると、世界中のどこからでも同じ操作ができるというメリットはあります。自分のPCを使う必要もないので出張とか楽になるかも。
今回は、いよいよdashDBに接続できるようにセットアップされたRを利用して作成したデータを利用できるようにしてみます。
##R Scripts
Web画面を利用してRを利用できる機能が準備されています。
管理画面のメニューを Analytics->R Scriptとたどります。
このR画面はあらかじめdashDBへ接続させるためのライブラリなども組み込まれているようで特に難しい設定なしにテーブルデータを利用できるようになっています。
メニューにはサンプルデータベースからデータを取得してグラフを表示するようなものが並んでいます。どういうことができるのか試してみてください。
###自分でRスクリプトを作ってみる
画面に表示されているプラスマークをクリックすると、データソースの選択用のウィンドウが開きます。このウィンドウでソーステーブルを指定します。ソーステーブルのカラムも選ぶことができます。
選択し終えると、ソーステーブルからデータを取得して、Rのデータフレームへセットするところまでが自動的に記入されます。
サンプルでこんなスクリプトを書いてみました。
library(ibmdbR)
mycon <- idaConnect("BLUDB", "", "")
idaInit(mycon)
df1439441638046 <- as.data.frame(ida.data.frame('"DASH102187"."APPL_LOG"')[ ,c('DATE_STRING', 'ERAPSED_TIME', 'SERVER_NAME', 'SQL_ID', 'TIME_STRING')])
# この上の行までは自動生成されました。
# データフレームをファクターに分類
f<-factor(df1439441638046$SQL_ID)
# サマリーを表示
summary(f)
# グラフ化してみます
plot(f,main="call count by SQL_ID",xlab="SQL_ID",ylab="count")
実行してみます…
あれ?Plot結果が表示されません。同時に作成されていたPDFファイルのアイコンをクリックするとグラフがPDFファイル化されてダウンロードできます。
ちょっと変ですが、中に含まれるSQLごとの度数をヒストグラムにしています。
この画面をちょっと触ってみましたが、スクリプトを頭から実行しなくてはいけないので試行しながらスクリプトを作るときには不便。まぁ、出来上がっているスクリプトを実行するのであればファイルも保存できるし、読み出しもできるのでいいのかもしれません。
##R Studio
Rの統合環境であるR Studioが利用できます。画面の R Studioボタンを押します。
あらためてログオン画面が表示され、ユーザー、パスワードを聞かれます。ログオンするためのユーザー、パスワードはmenuのConnectに書かれているユーザーとパスワードを利用します。それを利用してログオンしてください。(ちょっとしたトラップです。自分はBluemixのユーザーID,パスワードを何度も入力していました。)
Rスクリプトを利用するのであれば、Web管理画面ではなく、こちらの方がオススメです。
##次回
R Studioを使ってログデータを分析し、グラフを作成してみます。
シリーズ一覧
1.BluemixでAnalytics 〜dashDBを作って見る
2.BluemixでAnalytics 〜dashDBにデータをロードしてみる
3.BluemixでAnalytics 〜dashDBをSQLで操作してみる
4.BluemixでAnalytics 〜dashDBをRから使ってみる
5.BluemixでAnalytics 〜dashDBにR Studioから接続してみる