※今回の内容はYouTube動画でもご紹介しています。
1標本のt検定とは
1標本のt検定は、ある母集団の平均値と、収集した1標本の平均値を比較する(差の有無等を比較する)統計手法です。
1標本のt検定が使われる場面
1標本のt検定は、たとえば、以下のような場面で利用されることがあります。
- 全国の中学生と、自分が勤務する中学校の生徒とで体重の平均値に差があるかを比較する。
- 工場で生産している製品A(80gと規定)が規定のグラム数通りに生産されているか、いくつか標本を採集して確認する。
- ヨーグルトの製造業者が、国内競合メーカーの諸製品に含まれるカルシウムの平均含有量(mg)と自社製品群における平均含有量に差があるかを比較する。
1標本のt検定のステップ
1標本のt検定を実施する流れは次のようになります。
1.帰無仮説と対立仮説の設定
統計的仮説検定では、検証したい内容と反対の内容を「帰無仮説(H0)」として設定し、この帰無仮説を棄却することを目指します。ここで帰無仮説と対立仮説とは、以下を意味します。
- 帰無仮説(H0): (標本の)母集団の平均値が特定の値と等しいと仮定する。
- 対立仮説(H1): (標本の)母集団の平均値が特定の値と異なると仮定する。
2.有意水準の設定
帰無仮説を棄却する際の判断基準として有意水準を設定します。有意水準は、0.05(5%)を一般的に用います。
3.検定統計量(t値)を計算する
次に、この仮説に対する検定統計量(t値)を計算します。t値は標本の平均、標準偏差、標本数を用いて算出します。
t値の算出は、数式を使って手計算で行おうとすると時間や労力がかかります。そのため、実務ではこのプロセスを統計ソフトに任せることがほとんどです。
1. p値の算出
t値を算出した後は、得られたデータの希少性を表す確率値であるp値を求めます。p値は「t分布表」にt値と自由度を当てはめて得られます。
しかし、このやり方ではやはり手間がかかってしまうため、統計ソフトで自動算出することが多いです。
2. 結論の導出
算出したp値と、2で設定した有意水準を比較します。有意水準よりp値が小さければ、帰無仮説は棄却され、対立仮説が採択されます。これによって、母集団の平均値が特定の値と等しくない(=異なる)と解釈できます。
手計算なしで1標本のt検定を実施
1標本のt検定についてのざっくりとした説明は以上です。数式を用いて手計算で実施する場合は、ここから先は読まずに関連する解説記事をwebで見つけてみてください。
ですが、数式を使った計算が苦手(私もそうです)or業務が忙しくて手計算に時間をかけられないという方のために、ここから統計ソフトを使った実施法をおまけで説明します。
統計ソフトを今まで使ったことがなくてもご心配なく。
統計ソフト「JMP(ジャンプ)」には、30日間すべての機能を無料で利用できるトライアル版があります。よければ試してみてください。
30日間全機能無料のトライアル版はこちら
https://www.jmp.com/ja_jp/download-jmp-free-trial.html?utm_campaign=bl&utm_source=JMPblog&utm_medium=social
では、実際に例題を使って考えてみましょう。
【例題】
下の表は、今年、A大学の学生15人の身長を測定したデータです。この大学で20年前に測定した身長データの母平均は168.3cmでした。20年前と比べて身長の平均値に違いは見られるでしょうか。
学生番号 | 身長(cm) |
---|---|
1 | 163.5 |
2 | 177.8 |
3 | 183.0 |
4 | 172.7 |
5 | 168.4 |
6 | 175.5 |
7 | 160.3 |
8 | 180.2 |
9 | 165.8 |
10 | 174.6 |
11 | 162.9 |
12 | 177.4 |
13 | 180.5 |
14 | 169.8 |
15 | 176.5 |
上の表の身長の数値をざっと見ていくだけでは、20年前の身長の平均値との間に意味のある差があるかどうか判断するのは難しそうです。そこで、客観的に統計的検定を用いて判断してみましょう。
1) まず、帰無仮説を設定します。今回は、「今年測定したデータの母集団平均は168.3 (=20年前の母平均) と等しい」になります(ちなみに、対立仮説(H1)は、「今年測定したデータの母集団平均は168.3 (=20年前の母平均) と異なる」です。
2) 上の表のデータをJMPに読み込ませます。画面上の[分析]>[一変量の分布]と進み、[Y,列]に「身長」を入れて「OK」で実行し、表示されたレポートを横に積み重ねて表示させます(「一変量の分布」横の下▼から「積み重ねて表示」を選択)。
3) 次に、上記測定値が正規分布に従っていると仮定できるかの確認をしておきましょう。「身長」横の下▼から「正規分位点プロット」を選択すると以下のようなレポートが新たに表示されました。
赤枠部分を見ると、今回測定したデータ値は赤い点線の信頼区間の内側にあるため、正規分布していると仮定できそうです。
4) さらに、「身長」横の下▼内、「平均の検定」の「仮説平均を指定」に168.3を入力して「OK」で実行します。すると、以下のようなレポートが表示されました。
統計ソフトの場合は手計算をする必要がないので、検定統計量(t値)、自由度、p値を一瞬で求めることができます。
また、レポートでは、これらの値だけではなく平均、標準偏差、平均の上側&下側95%信頼区間、平均の標準誤差等も同じウィンドウにひとまとめに表示されるため、データの検討を行う際に便利です。
5) さて、このレポートに戻ってみてみると、両側検定のp値(Prob>|t|)は0.0345とあり、今回設定した有意水準(0.05)より小さいため、帰無仮説を棄却できます。
これによって、今年測定したデータの母平均は、20年前に収集したデータの平均値(=168.3) と異なることがわかりました。
いかがでしたか?1標本のt検定とはどのような統計手法なのか、今回の記事でイメージをつかんでいただけたなら嬉しいです。
t検定について、さらに詳しく知りたい方は以下のWebページもおすすめです。
【3分でざっくり理解】t検定とは?具体例で初心者にもわかりやすく
https://qiita.com/JMP_Japan/items/6538ae8a4c8261648159
【3分でざっくり理解】「対応のあるt検定」をわかりやすく解説
https://qiita.com/JMP_Japan/items/7c7d8787a8300b7827ca
Statistics Knowledge Portal (t検定)
https://www.jmp.com/ja_jp/statistics-knowledge-portal/t-test.html?utm_campaign=bl&utm_source=JMPblog&utm_medium=social