Edited at

Macでデータマインニングする下準備

More than 3 years have passed since last update.

売上データ分析とか、アクセス解析、コンサル的な統計学の世界を自宅でも体験してみたいと思ったので準備だけしてみる。ゲーム屋さんや運用フェーズに入ったサービスを持ってる人は色々とRで遊べるんだろうな・・・。

ビジテクの分析シリーズ並みにわかりやすい、ビジネスに特化した初心者向けR分析本はないかしらん??

ロースハラミ現象とか、面白そうだ♪


Rのインストール

事前にHomebrewcaskを入れておくこと。

テスト用DBとしてMySQLがインストイールされていること。


$brew install r

$brew cask install rstudio


アプリケーションからRStudioをクリックしR起動。

もしくはターミナルから"r"でRターミナル起動。


DBIパッケージのインストール


$install.packages("DBI")

$install.packages("RPostgreSQL")

$install.packages("RMySQL")

$install.packages("RSQLite")


取り敢えずPostgreSQL、MySQL、SQLiteを、それぞれ入れとく。


接続テスト(MySQL編)


>par(family="HiraKakuProN-W3")

※Font指定(Macで日本語を使うためには必要らしい)

>library(DBI)

>library(RMySQL)

>dataset <- dbGetQuery(dbConnect(dbDriver("MySQL"), dbname="データベース名", user="ユーザー名", password="パスワード"), "select * from データベース名.テーブル名;")

>View(dataset)

>dbDisconnect(dataset)


当たり前だけど、テスト前にMySQLを立ち上げとかないと繋がりません。


>$ mysql.server start



RMySQLのverが0.10.9だと以下の警告が出るかも・・・

警告メッセージ:

1: .local(conn, statement, ...) で:

Unsigned INTEGER in col 1 imported as numeric

2: .local(conn, statement, ...) で:

Unsigned INTEGER in col 3 imported as numeric

対策


>remove.packages('RMySQL')

>install.packages('devtools')

>devtools::install_github("rstats-db/RMySQL")

verが0.11.3以上になっているはず。

>q()

再度RStudioを起動し、接続テストしてみる。



絶対に入れといたほうがいいパッケージ

ggplot2


Rでは無いけどmコマンドが速くて軽いらしい。

mコマンドで数億行を高速集計

NYSOL


参考にさせて頂いたサイト

データマイニング講座

RからDBに接続する方法

RからAPI経由でGoogleアナリティクス

初心者でもできる|RでGoogle Analytics解析

文系がゼロから統計を勉強するときに最初の1年で読むべき本

R言語を使うときの資料

R情報検索

データマイ二ング コンテスト

データマイ二ング コンペ(日本)

総務省統計局データ

(スライド)データビジュアライゼーション事始め

(スライド)相関分析による需要予測

(スライド)競争ポジショニング戦略

(スライド)RユーザーのためのMコマンド

(スライド)日本発の大規模データ解析用OSS