More than 1 year has passed since last update.

標本調査に必要なサンプル数・得られたサンプルの信頼性について

Posted at 2024-03-02

いいこと調べたけど、メモしないと一瞬で忘れそうなので書きます。

必要なサンプルサイズ

全数調査ができないときにどのくらいのサンプルを集めると信頼性のある判断が得られるかという問題について。

としたとき必要なサンプルサイズは、

n=\frac{Nz^{2}p\left(1-p\right)}{e^{2}\left(N-1\right)+z^{2}p\left(1-p\right)}

となるそうです。

z(zスコア)は信頼区間が標準偏差何個分になるかの値で、95%信頼区間なら1.96というあれです。

pはアンケートの回答が得られた割り合いではなく、タレント好感度(好きと答えた人の割合)のような感じです。

eは、サンプルから得られたpが前後何%までブレるのを認めるかという許容誤差です。

例えばあるタレントの好感度を調査するとします。pは当然わからないので50%としておきます。

pが50%のとき、必要なサンプルnが最大化するので、50%からズレる分には精度が増すので問題ありません。

許容誤差は5%とします。

母集団は日本人でざっくり1億2000万人とします。これらを当てはめ上記を計算すると、

n=384.1587734

となりました。本当に無作為に385人の人にタレントの好感度を尋ねると、日本全体における好感度を±5%の精度でわかり、その推測が外れる可能性は5%未満ということです。

次に逆の問題を考えてみます。無作為で行われたアンケートの結果がどのくらい信頼できるものかを評価するものです。

ちょっと極端ですが、子供が「学校のみんな持ってるよ！」と言ってきたとき、証言の数で本当にみんなが持っていると言えるのかを検証するような感じです。

先ほどのnについての関数をzについて変形します。するとこのようになりました。

z=\sqrt{\frac{ne^{2}\left(N-1\right)}{\left(N-n\right)p\left(1-p\right)}}

これを先ほどのタレント好感度の数値で検算してみます。すると、

z=1.962144826

という結果が得られるので、どうやら正しいと言えそうです。

zスコアから信頼区間を求めるには、標準正規分布の累積度数分布関数が使えます。例えばGoogleスプレッドシートではNORMSDISTが使えます。

=NORMSDIST(1.962144826) * 2 - 1

信頼区間は両側なので、=NORMSDIST(z)-(1-NORMSDIST(z))としなければなりません。これを変形すると上記になります。

その結果、

信頼区間=0.9502543747

となり、ほぼ95%に逆算できました。

偏った回答の場合、サンプルは少なくて済みます。

結果が半々の場合は慎重に吟味しないといけないけど、偏りがある場合はもっと早い段階で傾向がわかり、覆る可能性は低いという感じでしょうか。

例えば、タレント好感度の結果が99%とわかっている場合、

n=15.2127342

となります。

日本人から無作為に16人を抽出し、全員がそのタレントを好きだと言ったら日本人の99%がそのタレントを好きである可能性が高いということです。

いわゆる出口調査的な話ですが、たった16人の意見で1億2000万人の大勢がわかるなんて面白いですね。

初歩的な統計学ですが、自分でハンズオンしてみて使える実感が湧きました！

間違いがあるかもなので、見つけたら優しく教えてください^^;