1. 背景
統計的な分析において、サンプルサイズについて考える機会があり、その過程でデルタ法を使用する場面がありました。
統計検定準1級の学習を通じて、デルタ法の公式自体は暗記していましたが、実際の分析でどのように適用するのかについては具体的なイメージを持てていませんでした。今回、具体的な利用場面を通じて理解を深めることができたため、備忘録として記事にまとめます。
個人的な学習記録として作成した記事のため、内容に誤りや改善点がありましたら、ご指摘いただけますと幸いです。
2. 記事の概要
母集団の性質を推定する際には、以下の統計量を用います。
- 平均値
- 分散
- 標準偏差
しかし、これらは取得した標本データから推定される値であるため、必ず推定誤差を伴います。
そのため、分析を行う前に「どの程度の精度で推定したいのか」「その精度を達成するためには、どれだけのサンプルサイズが必要なのか」を事前に設計することが重要です。
一般的なサンプルサイズ設計は「平均値の差の検定(t検定など)」を対象としたものが主流であり、「標準偏差の推定精度」に焦点を当てた解説は比較的ニッチかと思います。そこで本記事では、標準偏差の推定精度(相対的な許容誤差)から、デルタ法(大標本近似)を用いて必要なサンプルサイズを逆算する考え方について数式を追いながら整理します。
3. 推定対象
$K$ 個のグループから代表値を取得することを考えます。各グループの代表値を以下とします。
$$\bar{x}_1, \bar{x}_2, \dots, \bar{x}_K$$
ここから平均と標準偏差を推定します。
-
平均
$$\hat{\mu}=\frac{1}{K}\sum_{i=1}^{K}\bar{x}_i$$ -
標準偏差
$$\hat{\sigma}=\sqrt{\frac{1}{K-1}\sum_{i=1}^{K}(\bar{x}_i-\hat{\mu})^2}$$
ここで重要なのは、$\hat{\sigma}$ は真の標準偏差 $\sigma$ そのものではなく、データから計算した「推定値」であるという点です。
4. サンプルサイズを考える必要性
例えば、以下のような範囲を設定する場合を考えます。
$$\hat{\mu} \pm 3\hat{\sigma}$$
標準偏差の推定誤差が大きいと、設定した範囲自体が不安定になります。つまり、サンプルサイズが小さいと「推定誤差が大きい」「推定値の変動が大きい」状態となり、適切な判断ができません。
5. 標本分散とχ²分布
各代表値 $\bar{x}_i$ が互いに独立で同一の正規分布に従うと仮定するとき、標本分散について以下が成立します。
$$\frac{(K-1)\hat{\sigma}^{2}}{\sigma^{2}}\sim\chi^2(K-1)$$
$\chi^2(K-1)$ 分布は、独立な標準正規分布の二乗和で表されます。
$$\chi^2(K-1)=\sum_{i=1}^{K-1}Z_i^2$$
ここで、$$Z_i\sim N(0,1)$$ です。
6. 標準偏差推定値の標準誤差
標準正規分布 $N(0,1)$ に従う確率変数 $Z$ について、以下が成り立ちます。
$$E[Z^2]=1, \quad E[Z^4]=3$$
したがって、$Z^2$ の分散は以下の通りです。
$$\mathrm{Var}(Z^2)=E[Z^4]-(E[Z^2])^2 = 3 - 1 = 2$$
これより、自由度 $K-1$ の $\chi^2$ 分布の分散は各項の分散の和となるため、以下となります。
$$\mathrm{Var}(\chi^2(K-1))=2(K-1)$$
5章の関係式を代入すると、標本分散の分散は以下のように表せます。
$$\mathrm{Var}\left(\frac{(K-1)\hat{\sigma}^2}{\sigma^2}\right)= 2(K-1)$$
ここで $\hat{\sigma}^2$ 以外の定数倍を $\mathrm{Var}$ の外へ括り出します。
$$\left(\frac{K-1}{\sigma^2}\right)^2\mathrm{Var}(\hat{\sigma}^2)=2(K-1)$$
両辺を整理すると、標本分散の分散が求まります。
$$\mathrm{Var}(\hat{\sigma}^{2})=\frac{2\sigma^4}{K-1}$$
7. デルタ法による標準偏差の誤差評価
標準偏差は $\sigma=\sqrt{\sigma^2}$ であるため、平方根の関数 $g(x)=\sqrt{x}$ を定義します。これを微分すると以下になります。
$$g'(x)=\frac{1}{2\sqrt{x}}$$
デルタ法による近似公式 $\mathrm{Var}(g(X))\approx (g'(\mu_X))^2 \mathrm{Var}(X)$ を適用します(ここで $X = \hat{\sigma}^2, \mu_X = \sigma^2$)。
$$\mathrm{Var}(\hat{\sigma})\approx \left( \frac{1}{2\sqrt{\sigma^2}} \right)^2 \mathrm{Var}(\hat{\sigma}^2) = \frac{1}{4\sigma^2} \cdot \frac{2\sigma^4}{K-1} = \frac{\sigma^2}{2(K-1)}$$
したがって、標準偏差推定値の標準誤差 $SE(\hat{\sigma})$ は以下の通りです。
$$SE(\hat{\sigma})=\frac{\sigma}{\sqrt{2(K-1)}}$$
8. 許容誤差から必要サンプルサイズを決める
標準偏差推定値の相対誤差を $\varepsilon$ と定義します。
95%信頼区間において、推定値の相対誤差が $\varepsilon$ 以内に収まる条件は以下のように表されます。
$$1.96\times\frac{SE(\hat{\sigma})}{\sigma}\leq\varepsilon$$
ここに先ほど求めた $SE(\hat{\sigma})$ を代入します。
$$1.96\times\frac{1}{\sqrt{2(K-1)}}\leq\varepsilon$$
両辺を二乗して $K$ について整理します。
$$\boxed{K\geq1+\frac{1.96^2}{2\varepsilon^2}}$$
これが、必要サンプルサイズを設計するための式となります。
9. 今回のサンプルサイズ設計のまとめ
本記事では、「何個集めれば良いか」という直感的なアプローチではなく、「どの程度の推定誤差を許容するか」という観点から相対誤差 $\varepsilon$ を先に決定することで、論理的に必要なサンプルサイズを設計する方法を整理しました。
今回導出した設計式が一般的な解説記事であまり見られないのは、実務におけるサンプルサイズ設計の多くが「A/Bテストのような平均値の差の有意性」を対象としており、「単一の標準偏差の推定精度」そのものをターゲットにするケースが比較的ニッチな領域であるためかと考えられます。