統計検定2級に向けて
ガチ初心者のアウトプットです分散(valiance)
散布度の指標全てのデータを使う
+-関係なく考えたいので二乗を使う
平均からの偏差の二乗の平均
各データがどれだけ平均から離れているかを考えるための指標
標準偏差(standard deviation)
平均からの偏差の二乗の平均(分散)の平方根散布度(データの散らばり)
全てのデータを使いたい
→平均値からどれくらい離れているかを見るとわかる
→マイナスすると0になってしまうため
→二乗する(分散)
→尺度が変わってしまうので平方根(標準偏差)
共分散(covariance)
2変数間の相関関係を表す指標共分散行列という行列を取る場合もある
正の相関と負の相関
共分散の結果が正になる分散→片方の変数の値が高ければもう片方も高い共分散の結果が負になる分散→片方の変数の値が高ければもう片方は低い
相関係数(correlation coeffeicient)
共分散を標準化したもの共分散の取りうる値(最小値~最大値)を計算し、-1~1の範囲にすることを考える