LoginSignup
9

More than 5 years have passed since last update.

Macでデータマインニングする下準備

Last updated at Posted at 2016-09-07

売上データ分析とか、アクセス解析、コンサル的な統計学の世界を自宅でも体験してみたいと思ったので準備だけしてみる。ゲーム屋さんや運用フェーズに入ったサービスを持ってる人は色々とRで遊べるんだろうな・・・。

ビジテクの分析シリーズ並みにわかりやすい、ビジネスに特化した初心者向けR分析本はないかしらん??
ロースハラミ現象とか、面白そうだ♪

Rのインストール

事前にHomebrewcaskを入れておくこと。
テスト用DBとしてMySQLがインストイールされていること。

$brew install r

$brew cask install rstudio

アプリケーションからRStudioをクリックしR起動。
もしくはターミナルから"r"でRターミナル起動。

DBIパッケージのインストール

$install.packages("DBI")

$install.packages("RPostgreSQL")

$install.packages("RMySQL")

$install.packages("RSQLite")

取り敢えずPostgreSQL、MySQL、SQLiteを、それぞれ入れとく。

接続テスト(MySQL編)

>par(family="HiraKakuProN-W3")
※Font指定(Macで日本語を使うためには必要らしい)

>library(DBI)

>library(RMySQL)

>dataset <- dbGetQuery(dbConnect(dbDriver("MySQL"), dbname="データベース名", user="ユーザー名", password="パスワード"), "select * from データベース名.テーブル名;")

>View(dataset)

>dbDisconnect(dataset)

当たり前だけど、テスト前にMySQLを立ち上げとかないと繋がりません。

>$ mysql.server start

RMySQLのverが0.10.9だと以下の警告が出るかも・・・

警告メッセージ:
1: .local(conn, statement, ...) で:
Unsigned INTEGER in col 1 imported as numeric
2: .local(conn, statement, ...) で:
Unsigned INTEGER in col 3 imported as numeric

対策

>remove.packages('RMySQL')

>install.packages('devtools')

>devtools::install_github("rstats-db/RMySQL")
verが0.11.3以上になっているはず。

>q()
再度RStudioを起動し、接続テストしてみる。

絶対に入れといたほうがいいパッケージ

ggplot2

Rでは無いけどmコマンドが速くて軽いらしい。

mコマンドで数億行を高速集計
NYSOL

参考にさせて頂いたサイト

データマイニング講座
RからDBに接続する方法

RからAPI経由でGoogleアナリティクス
初心者でもできる|RでGoogle Analytics解析

文系がゼロから統計を勉強するときに最初の1年で読むべき本
R言語を使うときの資料
R情報検索

データマイ二ング コンテスト
データマイ二ング コンペ(日本)
総務省統計局データ

(スライド)データビジュアライゼーション事始め
(スライド)相関分析による需要予測
(スライド)競争ポジショニング戦略

(スライド)RユーザーのためのMコマンド
(スライド)日本発の大規模データ解析用OSS

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
9