はじめに
Rを学びたい Step23です。今回は帰無仮説と対立仮説に関して学びます。
帰無仮説と対立仮説は、何かを調べたり確かめたりするときに使う「考え方」です。
帰無仮説とは
「何も特別なことは起きていない」という前提のことです。
一旦、「特に変わったことはない」と考えて、それが本当に正しいのかを調べます。
例:お菓子の袋に入っている数
• あなたは、「このお菓子の袋には10個のお菓子が入っている」と信じています。
• 帰無仮説(何も特別なことはない):
• 「袋には10個のお菓子が入っている」と仮定します。
1. 帰無仮説 ( H_0 ) の数学的定義
• 定義:
帰無仮説 H_0 は、「特に変わったことがない」という仮定や主張を表します。検定ではまずこの仮説を正しいと仮定して検証します。
数学的な形式
• 母集団のパラメータに関する主張として書かれる:
H_0: \theta = \theta_0
\
\begin{align}
&\theta :母集団のパラメータ(例:平均、分散など)\\
&\theta_0 :特定の値(帰無仮説で仮定される値)\\
\end{align}
\
対立仮説
「帰無仮説が間違っているかもしれない」という考え方です。
「何か特別なことが起きている」と言えるかを確認します。
例:お菓子の袋に入っている数(続き)
• 対立仮説(帰無仮説が間違っているかも):
• 「袋には10個ではない数のお菓子が入っているかもしれない」と考えます。
H_1: \theta \neq \theta_0
\
\begin{align}
&\theta :母集団のパラメータ(例:平均、分散など)\\
&\theta_0 :特定の値(帰無仮説で仮定される値)\\
&H_1 :\theta \text{が } \theta_0 \text{ と異なる場合(両側検定)} \\
\end{align}
\
帰無仮説と対立仮説の使い方
- まずは帰無仮説を信じる:
•「特に変わったことはない」と仮定して調査を始めます。
2.調査や実験をする:
• 実際にお菓子の袋を開けて中身を数えてみます。 - 結果から判断する:
• お菓子が10個入っていれば、「帰無仮説は正しそう」と考えます。
• もし9個や11個だったら、「帰無仮説は間違っているかも」と判断します。
例題で理解する:コインを投げる場合
問題:コインが公平(表も裏も同じ確率で出る)か調べたい
• 帰無仮説:
• 「このコインは公平で、表と裏が出る確率は同じ。」
→ つまり、特に変わったことはないと考えます。
• 対立仮説:
• 「このコインは公平じゃないかもしれない。」
→ つまり、表や裏が出る確率が偏っているかもと疑います。
調査方法:
• コインを10回投げて、表と裏の回数を調べます。
• もし表が10回連続で出たら、「このコインは公平じゃないかも」と考えます(帰無仮説を疑う)。
• もし表が5回、裏が5回だったら、「このコインは公平かもしれない」と考えます(帰無仮説を受け入れる)。
Rでまなぶ
例題:学生のテスト平均点が75点かどうかを検証
• 帰無仮説 ( H_0 ): 学生のテストの平均点は75点である。
• 対立仮説 ( H_1 ): 学生のテストの平均点は75点ではない。
# サンプルデータ生成(学生のテスト点数)
set.seed(123) # 再現性のため
sample_scores <- rnorm(30, mean = 78, sd = 10) # 平均78、標準偏差10のデータを30個生成
# データの要約
summary(sample_scores)
hist(sample_scores, breaks = 10, col = "skyblue",
main = "Histogram of Test Scores",
xlab = "Scores")
# 仮説検定
# 帰無仮説: 平均点 = 75
# 対立仮説: 平均点 ≠ 75(両側検定)
t_test_result <- t.test(sample_scores, mu = 75)
# 結果を出力
print(t_test_result)
# 結果の解釈
if (t_test_result$p.value < 0.05) {
cat("帰無仮説を棄却します。平均点は75ではありません。\n")
} else {
cat("帰無仮説を棄却できません。平均点は75と考えられます。\n")
}
Min. 1st Qu. Median Mean 3rd Qu. Max.
58.33 71.29 77.26 77.53 82.89 95.87
One Sample t-test
data: sample_scores
t = 1.412, df = 29, p-value = 0.1686
alternative hypothesis: true mean is not equal to 75
95 percent confidence interval:
73.86573 81.19219
sample estimates:
mean of x
77.52896
帰無仮説を棄却できません。平均点は75と考えられます。