別の所から持ってきたけど、リンクが良くないので少しずつ直す
一度、上げてましたが直したい所があったので、上げ直し。
#Rについて
https://ja.wikipedia.org/wiki/R%E8%A8%80%E8%AA%9E
https://www.r-project.org/
#設定等
- ライブラリのインストール
install.packages(”HOGE”)
- ライブラリの管理について Rのパッケージ管理 (アップデート 、読込済みパッケージ一覧の表示方法)
ライブラリによっては、前提として入っていなければいけないライブラリがあったりするので注意すること。(dplyr, tidyrで少し困った。)
dependencies = TRUE
とすることで、関連するライブラリが自動で入るっぽい。 - グラフ化(可視化) ライブラリggplotを使用 http://ggplot2.org/
- ライブラリの呼び出し方
library(ggplot2)
- ライブブラリアップデート
update.packages()
- 作業ディレクトリの設定
getwd()
- その他の便利なライブラリ一覧
GGally,corrplot,psych,qgraph
##データ準備
データ読み込み read.csv("hoge.csv",header = T,sep = ",")
41. EXCEL のデータを読み込む
##分析等
- (ピアソン)相関分析
cor.test(iris $ Sepal.Length, iris $ Sepal.Width, method="pearson")
R言語で統計解析入門: ピアソンの積率相関係数と(無相関)検定 梶山 喜一郎 - 単回帰分析と予測区間について線形モデルによる回帰 lm() 予測区間 信頼性区間について predict()
-
Excelで回帰分析の予測区間を描く - Qiita ggplotによる散布図作図
単回帰 | 回帰分析 | Logics of Blue - 統計学入門−第5章 統計的な捉え方や考え方について
- 信頼区間の意味と、Rのpredict()関数の使い方の注意点 - StatsBeginner: 初学者の統計学習ノート Rで順番に説明してあるのでわかりやすい。
##グラフ化
-
ggplotによるグラフ化
ggplot(piyo,aes(x = before,y = after)) + geom_point(aes(color = hogehoge))
-
Amazon.co.jp: みんなのR -データ分析と統計解析の新しい教科書-: Jared P. Lander, Tokyo.R(協力), 高柳慎一, 牧山幸史, 簑田高志: 本
-
ggplot2 の自分用メモ集を作ろう - Triad sou.
-
ggplot2 (公式)
-
散布図行列 GGallyライブラリパッケージ ggpairs関数がよさそう。 psychパッケージ
-
美しいペアプロット図を簡単に作る - 驚異のアニヲタ社会復帰への道 ggpairsについて
-
美しいペアプロット図を簡単に作る - My Life as a Mock Quant psychパッケージについて
-
散布図に回帰直線を追加する。 geom_smooth(method=lm,se=FALSE)
##データ生成
ランダムデータ生成 正規分布 x <- rnorm( n=3000 )
##データ処理
- dplyr, tidyrというライブラリが良いらしい。
- R dplyr, tidyr でのグルーピング/集約/変換処理まとめ - StatsFragments
##行列操作
- 行列の入替え
data1 <- t(data)
データフレームの行列入れ替え|ぎょうむ日誌 / R言語で統計解析入門: データフレームの行と列の入れ替え (転置行列) 梶山 喜一郎
##その他
本当のチートシート RStudio - Cheatsheets
まとめ http://stat.biopapyrus.net/
#おまじないメモ
install.packages("ggplot2", dependencies=TRUE)
#Rでpythonを動かす。(windows向け)
- pythonをインストールする。
install.packages("PythonInR", dependencies=TRUE)