0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

[Statistics] t分布 とは

Posted at

概要

t分布(Student’s t-distribution)は、母分散が未知 の場合に標本平均を扱うために導入された連続確率分布です。

  • 正規分布と同様に左右対称で、平均 0 を中心に持つ。
  • 裾が厚く、外れ値の影響を受けやすい。
  • 標本サイズが大きくなると、標準正規分布に近づく。

統計的推測(母平均の推定・検定)で特に重要になるのは、「母分散未知・標本サイズが小さい」場合です。

各分布の使用条件

数式

母集団が正規分布に従い、母分散が未知のとき、標本平均 $\bar{X}$ を使って定義される t 統計量は:

$$
T = \frac{\bar{X} - \mu}{s / \sqrt{n}}
$$

ここで:

  • $\bar{X}$ : 標本平均
  • $\mu$ : 母平均
  • $s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{X})^2$ : 不偏分散
  • $n$ : 標本サイズ

このとき、

$$
T \sim t(n-1)
$$

となり、自由度 $n-1$ の t 分布に従います。

数式の説明

  1. 自由度の意味

    • 標本分散 $s^2$ を計算するとき、標本平均 $\bar{X}$ を1つ消費しているため、自由に動ける値は $n-1$。
    • したがって t 分布は「自由度 $n-1$」で表される。
  2. 形の特徴

    • 平均 0 を中心に左右対称。
    • 裾が厚い → 標本サイズが小さいときに極端な値が出やすいことを反映。
    • 標本サイズ $n$ が大きくなると、$t(n-1)$ は標準正規分布 $N(0,1)$ に近づく。
  3. 使い分け

    • 母分散が既知なら Z 分布を使う。
    • 母分散が未知なら t 分布を使う。
    • $n \geq 30$ 程度なら、近似的に Z を使ってもよい。

問題例

問題1:母分散未知の信頼区間

ある製品の重量を 5 個抽出し、標本平均 $\bar{X} = 102$、標本標準偏差 $s = 5$ が得られた。
母平均 $\mu$ の 95% 信頼区間を求めよ。

解き方

  1. t分布の自由度を決める
    標本サイズは $n=5$ なので、自由度は

    $$
    n-1 = 4
    $$

  2. t分布表から臨界値を探す
    自由度 4、両側 5%(片側 2.5%)に対応する t値は

    $$
    t_{4,0.025} = 2.776
    $$

    (画像中の表の 自由度4、上側2.5%点 が 2.776)

  3. t統計量の不等式を書く

    $$
    P\left(-2.776 \leq \frac{\bar{X} - \mu}{s/\sqrt{n}} \leq 2.776\right) = 0.95
    $$

  4. 両辺に $\frac{s}{\sqrt{n}}$ を掛け、整理する

    $$
    P\left(-2.776 \cdot \frac{s}{\sqrt{n}} \leq \bar{X} - \mu \leq 2.776 \cdot \frac{s}{\sqrt{n}}\right) = 0.95
    $$

    $$
    P\left(\bar{X} - 2.776 \cdot \frac{s}{\sqrt{n}} \leq \mu \leq \bar{X} + 2.776 \cdot \frac{s}{\sqrt{n}}\right) = 0.95
    $$

  5. 数値を代入

    • $\bar{X} = 102$
    • $s = 5$
    • $n=5$、よって $\frac{s}{\sqrt{n}} = \frac{5}{\sqrt{5}} = 2.236...$
    • $2.776 \times 2.236 \approx 6.2$

    よって信頼区間は:

    $$
    \mu \in [102 - 6.2, 102 + 6.2]
    = [95.8, 108.2]
    $$

問題2:t検定による母平均の検定

ある飲料の糖度の母平均が 5 であるかを検定したい。
標本サイズ $n=16$、標本平均 $\bar{X}=5.3$、標本標準偏差 $s=0.4$。
有意水準 5% で片側検定を行う。

解き方

  1. 帰無仮説:$\mu = 5$

  2. t統計量を計算:

    $$
    t = \frac{\bar{X} - \mu}{s / \sqrt{n}}
    = \frac{5.3 - 5}{0.4/\sqrt{16}}
    = \frac{0.3}{0.1} = 3.0
    $$

  3. 自由度 $15$ の t 分布で片側 5% の臨界値は $t_{15,0.05} \approx 1.753$。

  4. $t=3.0 > 1.753$ なので、帰無仮説を棄却。
    → 母平均は 5 より大きいといえる。

関連する数式

  1. t統計量(母分散未知)

    $$
    T = \frac{\bar{X} - \mu}{s / \sqrt{n}} \sim t(n-1)
    $$

  2. 信頼区間(母分散未知)

    $$
    \mu \in \left[ \bar{X} \pm t_{n-1, \alpha/2} \cdot \frac{s}{\sqrt{n}} \right]
    $$

  3. t検定の基本形

    • 1標本 t検定:母平均の検定
    • 2標本 t検定:2群の母平均差の検定
    • 対応のある t検定:同一個体の前後比較

参考リンク

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?