参考
予備知識
語句 | 説明 | 英単語 |
---|---|---|
seq |
連続する値 | sequence |
命名規則
変数
参考はこちらです。
データ型
データ型は4つです。
データ型 | 説明 | |
---|---|---|
1 | numeric | 数値型 |
2 | character | 文字列型 |
3 | factor | 因子型 |
4 | logical | 論理値型 |
データ構造
データ構造は6つです。
主に使用されるのは、vector
と data frame
の2つです。
データ構造 | 説明 | 詳細 | 使用方法 | |
---|---|---|---|---|
1 | vector | ベクトル | ベクトルは、1次元の配列です。要素が1つだけのベクトルは Scalar (スカラー) とも呼ばれます。 | c() |
2 | matrix | 行列 | ||
3 | array | 配列 | ||
4 | data frame | データフレーム | ||
5 | list | リスト | ||
6 | table | テーブル |
関数
データの「中心」を計算する関数
関数 | 説明 | 引数 |
---|---|---|
mean() |
平均値を計算します。 | |
median() |
中央値を計算します。 | |
summary() |
平均値・中央値などまとめて計算します。Min. 1st Qu. Median Mean 3rd Qu. Max. の計算です。 |
データの「ばらつき」を計算する関数
関数 | 説明 | 引数 |
---|---|---|
var() |
不偏分散を計算します。 | |
sd() |
標準偏差を計算します。 | |
IQR() |
四分位偏差を計算します。 |
データの「関連」を計算する関数
関数 | 説明 | 引数 |
---|---|---|
cov() |
共分散を計算します。 | |
cor() |
相関係数を計算します。 | |
lsfit() |
最小二乗法を用いた回帰分析です。 | |
lm() |
線形モデルを用いた回帰分析です。 Estimate Std. Error t value Pr(> | t |
glm() |
一般線形モデルを用いた回帰分析です。 |
その他
関数 | 説明 | 引数 |
---|---|---|
sqrt() |
平方根を計算します。 | |
hist() |
ヒストグラムを作成します。標準では「値1より大きくて値2以下」という階級を設定します。第一引数にデータベクトル、breaksでヒストグラムのビン(区間)の境界、mainでタイトル、xlabでx軸のラベル、ylabでy軸のラベル、その他の引数でさらにパラメータを与えます。 | `hist(x, breaks, main, xlab, ylab, ...) |
` | ||
seq() |
データを与えられた間隔で分割します。第一引数に開始値、第二引数に終了値、第三引数に間隔を与える。 | seq(from, to, by) |
scale() |
データをz得点に変換します。 | |
log() |
対数変換をします。 | |
ifelse() |
ダミー変数の作成に使用します。 |
hist_object[["element"]]
hist()
メソッドで作成されたヒストグラムオブジェクトは、いくつかのプロパティをもちます。利用可能なキー(プロパティ)には以下のようなものがあります:
プロパティ | 説明 |
---|---|
breaks |
ビンの境界値のベクトル。 |
counts |
各ビンに含まれるデータの数(度数)。 |
density |
各ビンの密度。 |
mids |
各ビンの中心値。 |
xname |
元のデータの名前。 |
equidist |
ビンが等間隔かどうかを示す論理値。 |