はじめに
統計学における母集団について簡単にまとめました。
統計学をなにも知らない人でもわかるように書きました~。
目次
- 母集団とは
- 有限母集団
- 無限母集団
- 全数調査
- 標本調査
1. 母集団とは
母集団とは、興味の対象全体のまとまりのことを言います。
例えば日本人の成人男性の身長に興味があれば、今存在している日本人成人男性全員(約5000万人)を母集団と考えます。
他の例では視聴率について興味があれば、テレビを所有する全ての世帯が母集団となります。
母集団に含まれる要素の数を母集団サイズといいます。
例えば上記成人男性の場合、母集団サイズ=5000万人となります。
この母集団の性質を知ることが、興味の対象の説明・理解につながります。
2. 有限母集団
有限母集団:母集団サイズが有限である母集団のこと
(例)
1で紹介した日本人成人男性や視聴率の母集団は有限母集団となります。
3. 無限母集団
無限母集団:母集団サイズが無限である母集団のこと
(例)
サイコロの出る目に対して興味がある場合、サイコロは永遠に振れるので出る目に際限はなく無限母集団となります。
4. 全数調査
母集団に含まれる全ての要素を調べる調査のことです。
例えば日本人成人男性の平均身長に興味があれば、日本人成人男性全員(約5000万人)の身長を測定しデータを取得後、平均値を計算することになります。
全数調査では、分析するデータ=母集団となります。つまり全てのデータを分析するだけで、母集団の性質や特徴を説明・理解できるようになります。このようなデータそのものの特徴を記述し要約することを記述統計といいます。
ただ全数調査を実施するには以下のようなデメリットがあります。
1.時間的コストがめちゃかかる
2.金銭的コストがめちゃかかる
3.無限母集団の調査はできない。
そのため基本的に統計学においては、全数調査よりも次に紹介する標本調査を実施することが多いです。
5. 標本調査
母集団の一部を分析することで母集団全体の性質を推測することを推測統計といいます。
推測統計で調査する母集団の一部を標本(サンプル)といい、標本を母集団から取り出すことを標本抽出(サンプリング)といいます。
標本から母集団の性質を調べることを 標本調査といいます。
例えば、TVの視聴率でいえば全世帯を調べるのではなく一部の世帯を対象にモニタリングを実施し、全世帯の視聴率を推測していたりします。
他にも日本人成人男性の平均身長に興味があれば、5000万人の全数調査を行うのではなく一部のサンプルを抽出し、そこから母集団全体の性質を推測します。