最近、統計を学んでいるので、備忘録がてらに投稿します。
本当に基礎の基礎から学び始めているので、当たり前のことも多いかもしれませんがご容赦ください。
#そもそも統計は何のために行うのか?
イギリスの物理学者ケルビンは、「結果を数値として表すことができるならば、それについてなんらかの知識を獲得したことになる」といっている。つまり、統計により自然現象や社会現象について数量化することで知識を深めていくことができるのである。
また、統計は行動決定の指針となる。国家や企業の経営にとっては、統計によって把握した規則や法則を行動指針として利用している。アメリカの統計学者デミング博士は、「統計は行動のためにある」といっている。
#統計は何を表すか?
一言でいえば、集団の特徴を数量的に表す役割を果たしている。
集団の内部構造を表す統計を作るためにとりあげる特性(男女別、年齢など)を観察の標識という。
観察の標識には①質的な特性、②量的な特性がある。
①質的な特性の例として、性別、職業、学歴など
②量的な特性の例として、収入、就業時間、身長、体重など
#統計的記述によって集団の特徴を要約する
観察の標識が軽量である場合には、数値の集合が与えられる。
数値の集合の特徴は点の分布状態の特徴を記述することになる。
最も重要なものは分布の中心の位置である。すなわち、平均である。
次に重要なのはバラツキの程度である。バラツキはそれぞれの数値と平均との差を平均することを意味する。
それぞれの数値から平均を引いた値―これを偏差という―を加え合わせると0になるから、符号を取り去ってから平均する。
また、偏差の2乗の平均を計算し、これによってバラツキの程度を測ることもできる。これを分散という。分散の平方根を標準偏差という。
とりあえずここまで。
次はさらに踏み込んだ内容を纏めます。