はじめに
この連載(?)はRと統計学を一緒に学ぼうというお気持ちで始めた連載です。
私も学びながら、記事を作っていきますので間違えている可能性があります、もし間違いを見つけた場合にはご指摘ください!
Rとは
Rは統計学・数値計算・機械学習などに優れた統計ツールです。
詳しくは第一回で触れますが、非常に様々な計算が「1行」で行えます。
ゴリゴリのプログラムというより、本当に手足のように扱える(ようになりたい)ツールといえます。
なぜ統計学を学ぶか
詳しくは第一回で解説しますが、統計学・確率論を使いこなせるようになると、様々なシーンで役に立ちます。
データを前に、エクセルに取り込んでから適当なグラフを作るだけの人を卒業したい!(もちろんこれも非常に大事なんですが)
ということで、教養的な知識としてRと統計学をしていこうという連載です。
理論にもほどほどに触れますが、数学的証明を与えたり、その正しさを明らかにするというよりは、その理論を理解して使えるようになることをメインの目標とします。
前提知識
前提知識は高校数学程度です。
時々大学レベルの積分も出ますが、ほとんどの意味合いにおいて以下のような面積を求めています。
これは、$f(x) = x^2$の関数で、1から3までの間で定積分したものです。
また、この面積はx=1、x=3、x軸、f(x)で囲まれた部分の面積とも言えます。
式にすると
$$
\int_1^3 x^2 dx \int_1^3 f(x) dx
$$
といったふうに表されます。
厳密なお話は置いておいて、概ねこのような意味があると理解して貰えれば大丈夫だと思います。(わからなかったら飛ばしちゃいましょう)
環境構築
どんな環境を使ってもらっても構いませんが、私はRStudioという統合開発環境を使っています。
分かりやすいし高機能で便利です。
Rのインストール
統計数理研究所のミラーサイトというRのサイトからダウンロード出来ます
他にも、山形大学のミラーサイトなどからもダウンロード出来ます
RStudioのインストール
RStudioのサイトからダウンロードします
Open SourceでFreeのRStudio Desktopで十分でしょう。
後は仰せのままにポチポチすればOkです!
もしRより先にRStudioをインストールするとRが無いよと言われるので、必ずRを入れてからRStudioを入れましょう。
連載目次
目次が必要なほど連載が続くかどうか分かりませんが...一応わかりやすく目次をつけておきます。
1. Rイントロダクション
2. 帰無仮説とp検定
3. t分布
4. Rでグラフを描きまくる
終わりに
一応目標は機械学習まで行ければなと思っています。
よろしくおねがいします。