統計検定2級試験対策に際して,抽出法の問題は頻出かつ,覚えていないと得点できない.
つまり,覚えてさえいれば楽に得点が出来る箇所である.
暗記ではなく、「どのような場面で使われるか」を意識して理解するのが重要.
1. 単純無作為抽出法(Simple Random Sampling)
母集団の全員が等しい確率で選ばれる抽出方法である。
乱数表やくじ引きなどを使い、完全に無作為に標本を選ぶ。
手順:
母集団全体の名簿を作成し、乱数表またはコンピュータで対象をランダムに選ぶ。
例:
1000人の中から100人を乱数で選ぶ。
特徴・Tips:
最も基本的な方法である。
母集団が均質な場合に有効である。
名簿が必要なので大規模調査では非効率である。
「すべての個体に同じ抽出確率」という文言が出たらこの方法である。
2. 層化抽出法(Stratified Sampling)
母集団をいくつかの層(グループ)に分けて、各層から無作為抽出する方法である。
母集団の構成比を反映させたいときに使う。
手順:
- 母集団を性別・年齢・地域などの層に分ける。
- 各層ごとに層の大きさに比例して標本数を割り当て、無作為抽出する。
例:
男女比7:3の高校で10人を調査する場合、男子7人・女子3人をそれぞれ無作為に選ぶ。
特徴・Tips:
各層の構成を保った標本が得られるため、精度が高い。
事前に母集団の層構成を知っておく必要がある。
層ごとに抽出することから「代表性の確保」がキーワードである。
出題では「男女別・地域別・学年別」などが層の例として登場する。
3. クラスター抽出法(Cluster Sampling)
母集団をクラスター(集落、小集団)に分け、その中からいくつかのクラスターを無作為に選び、選ばれたクラスター内の全員を調査する方法である。
手順:
- 母集団をクラスター(学校・企業・地域など)に分ける。
- いくつかのクラスターをランダムに選ぶ。
- 選ばれたクラスター内の全員を調査する。
例:
全国の高校をクラスターとし、ランダムに10校を選び、その10校の全生徒を調査する。
特徴・Tips:
調査コストを下げられる。
クラスター間の差が大きいと精度が低下する。
層化抽出との違いに注意する。
層化抽出は各層から一部を選ぶが、クラスター抽出は選んだグループ内の全員を調べる。
「クラスター全体を調査」がキーワードである。
4. 多段抽出法(Multistage Sampling)
クラスター抽出をさらに段階的に行う方法である。
広い範囲の調査を段階的に絞っていくイメージである。
手順:
- 第1段階:母集団をいくつかの大グループに分けて抽出する。
- 第2段階:抽出されたグループをさらに分け、再び無作為抽出する。
- 第3段階:最終的に個人単位で抽出する。
例:
①全国から30市区町村を無作為抽出する。
②それぞれから5地区を抽出する。
③各地区から20人を抽出する。
特徴・Tips:
段階的に抽出することでコストを削減できる。
調査対象が広い場合(全国調査など)に有効である。
「段階的に→多段」「市町村→地区→個人」というキーワードが出たらこの方法である。
5. 系統抽出法(Systematic Sampling)
一定の間隔で標本を抽出する方法である。
名簿に番号をつけて、等間隔に選ぶのが基本である。
手順:
- 母集団に通し番号をつける。
- 最初の1人をランダムに決める。
- 以降、一定の間隔で選んでいく。
例:
4000人に番号をつけ、最初をランダムに選び、3人おきに選んで1000人を抽出する。
特徴・Tips:
実施が容易で、単純無作為抽出に近い精度を得られる。
母集団に周期的パターンがあると偏りが出る。
「等間隔」「通し番号」という語句が出たらこの方法である。
試験では「周期性があると誤差が出る」という注意点を問われる。
6. 二相抽出法(Two-phase Sampling)
層化抽出を行いたいが、母集団の情報が不足しているときに使う方法である。
まず母集団の情報を得るために一度抽出(第1相)し、その結果をもとに本抽出(第2相)を行う。
手順:
- 第1相:母集団から一部を抽出して、構成比などの情報を調べる。
- 第2相:得られた情報を使って層化抽出などを実施する。
例:
男女比が不明な都市で、まず1万人を調査して男女比(6:4)を把握する。
その後、男性60名・女性40名をそれぞれ無作為に選ぶ。
特徴・Tips:
「層化したいが、層の情報がない」という場面で使用する。
二段抽出(multi-stage)と混同しやすいが別物である。
二相抽出は同じ母集団を2回抽出する。
多段抽出は異なる階層(地域→地区→個人)を順に抽出する。
「第1相」「第2相」という表現が出たらこの方法である。
出題対策まとめ(Tips)
| よく出る比較ポイント | 見分けのキーワード |
|---|---|
| 単純無作為 vs 層化抽出 | 「層(男女・地域など)」の有無 |
| 層化抽出 vs クラスター抽出 | 「層ごとに一部」か「グループごとに全員」か |
| クラスター vs 多段抽出 | 「1段階」か「複数段階」か |
| 系統抽出 | 「等間隔」「通し番号」 |
| 二相抽出 | 「第1相」「第2相」「母集団情報がない」 |
まとめの覚え方
単純無作為:基本中の基本である。
層化:精度を高めたい。
クラスター:コストを下げたい。
多段:段階的に調査したい。
系統:名簿があるときに効率よく。
二相:母集団情報がないときにまず調べる。
この6種類の抽出法は、統計検定2級の頻出テーマ(母集団・標本推定)である。
試験では「文章からどの抽出法かを判定」する形式で出題されるため、キーワード(層・クラスター・間隔・二相)を見逃さないようにする。