※今回の内容はYouTube動画でもご紹介しています。
対応のあるt検定とは?
対応のあるt検定は、同じ対象について複数回の測定を実施し、その母平均の差がゼロであるかどうかを検定する統計手法です。今回は、初心者の方向けに、基本から実際の使い方までわかりやすく解説します。
対応のあるt検定が使われる場面
対応のあるt検定では、同じ対象について、ある条件(実験、治療等)のもとで複数回の測定を行い、得られたデータをもとに分析します。具体的には、以下のような場面をイメージしてみてください。
- 血圧を下げる新薬の投薬前後において、被験者の血圧を比較する場合
- ビールのテイスティングで、同じグループが2種類のビールを飲み比べる場合
対応のあるt検定のステップ
では実際に例題を使って考えてみましょう(今回は、測定値の差が正規分布に従うと仮定します)。
【例題】
あるクリニックで、患者グループの体温を2種類の体温計(口と耳)で計測しました。その測定値の母平均に差があるかどうかを調べてみます。
患者 | 口部の体温(℃) | 鼓膜の体温(℃) | 差分(℃) |
---|---|---|---|
誠 | 36.1 | 36.0 | -0.1 |
智子 | 36.7 | 36.9 | 0.2 |
大輔 | 38.1 | 38.3 | 0.2 |
裕子 | 36.8 | 37.0 | 0.2 |
直樹 | 36.5 | 36.7 | 0.2 |
真由美 | 37.8 | 38.5 | 0.7 |
剛 | 36.9 | 37.0 | 0.1 |
香織 | 36.8 | 36.9 | 0.1 |
淳 | 36.6 | 36.8 | 0.2 |
裕美 | 37.3 | 37.4 | 0.1 |
大介 | 38.1 | 38.1 | 0 |
幸子 | 36.6 | 36.7 | 0.1 |
竜也 | 37.1 | 37.3 | 0.2 |
恵 | 36.9 | 36.8 | -0.1 |
学 | 36.8 | 37.1 | 0.3 |
優子 | 36.1 | 36.2 | 0.1 |
崇史 | 36.8 | 36.9 | 0.1 |
恵子 | 36.7 | 37.3 | 0.6 |
肇 | 36.6 | 36.8 | 0.2 |
桃子 | 36.9 | 36.9 | 0 |
上の表の体温や差分を見ただけでは、測定された体温の母平均に差があるかどうかの判断は人によって異なりそうです。そこで統計的検定を使うことで、客観的基準によって判断を可能にします。
1. 仮説を立てる
帰無仮説(H0): 口と耳でそれぞれ測定された体温の母平均に「差がない(ゼロである)」
対立仮説(H1): 2つの集団の母平均値に「差がある」
2. 検定統計量を計算する
まず、検定統計量(t)は以下の式で算出できます(以下の数式は長いので左右にスクロールしてください)。
\begin{flalign}
&
検定統計量(t)=\displaylines{
\frac{差分データの標本平均}{標準誤差}=
\frac{\bar{d}}{S_d/\sqrt{n} }
}
&
\end{flalign}
\begin{flalign}
&
差の平均値:\bar{d}=\displaylines{
\frac{1}{n}\sum_{i=1}^{n} d_i
}
&
\end{flalign}
\begin{flalign}
&
差の標準偏差:S_d=\displaylines{
\sqrt{\frac{1}{n-1}\sum_{i=1}^{n} (d_i-\bar{d})^2}
}
&
\end{flalign}
上の数式で、 n=標本数(今回は20)。
\begin{flalign}
&
\bar{d}=\displaylines{
\frac{1}{20}(-0.1+0.2+0.2+0.2+0.2+0.7+0.1+0.1+0.2+0.1+0+0.1+0.2+-0.1+0.3+0.1+0.1+0.6+0.2+0)=
\frac{3.4}{20}=0.17
}
&
\end{flalign}
\begin{flalign}
&
S_d=\displaylines{
\sqrt{\frac{1}{20-1} \bigl((-0.1-0.17)^2+(0.2-0.17)^2+(0.2-0.17)^2+(0.2-0.17)^2+(0.2-0.17)^2+(0.7-0.17)^2+(0.1-0.17)^2+(0.1-0.17)^2+(0.2-0.17)^2+(0.1-0.17)^2+(0-0.17)^2+(0.1-0.17)^2+(0.2-0.17)^2+(-0.1-0.17)^2+(0.3-0.17)^2+(0.1-0.17)^2+(0.1-0.17)^2+(0.6-0.17)^2+(0.2-0.17)^2+(0-0.17)^2\bigr)}=0.195
}
&
\end{flalign}
\begin{flalign}
&
検定統計量(t)=\displaylines{
\frac{差分データの標本平均}{標準誤差}=
\frac{\bar{d}}{S_d/\sqrt{n} }
=
\frac{0.17}{0.195/\sqrt{20} }=3.899
}
&
\end{flalign}
と検定統計量が算出できました。
3.有意水準を設定する
次に、有意水準(α)を設定します。今回は有意水準(α)=0.05としました。
4.t分布表からt値を見つける
統計学の本やWebページに掲載されているt分布表を用いて、設定した有意水準(α)と自由度からt値を見つけます。
今回、有意水準(α)は0.05、自由度は標本数(n)に基づいて、n-1=20-1=19になります。
そして、t分布表によると、有意水準(α=0.05)で自由度19の場合のt値 は2.093となることが分かりました。
5.結果を考察する
既に算出している検定統計量をt値 と比較します。すると、t値 (2.093)<検定統計量(3.899)となり、t分布の棄却域に入っています。
そのため、有意水準=0.05において、帰無仮説(口と耳でそれぞれ測定された体温の母平均の差がゼロである)は棄却されるという結果になります。
つまり、患者グループの体温は、口と耳で計測した場合、その測定値の母平均に差があるということが分かりました。
今回は以上です。対応のあるt検定は、手計算では煩雑で時間がかかってしまうため、実務では統計ソフトを使って実施するのが一般的です。興味がある方は、下のトライアル版を試してみてください。
30年以上の歴史がある統計ソフト「JMP(ジャンプ)」を試してみませんか?
JMPは体験版でもサンプルデータが豊富。プログラミング不要、マウス操作中心で探索的なデータ分析が可能です。
30日間全機能無料のトライアル版はこちら
https://www.jmp.com/ja_jp/download-jmp-free-trial.html?utm_campaign=bl&utm_source=JMPblog&utm_medium=social
また、t検定について、さらに詳しく知りたい方は以下のWebページもおすすめです。
【3分でざっくり理解】t検定とは?具体例で初心者にもわかりやすく
https://qiita.com/JMP_Japan/items/6538ae8a4c8261648159
【3分でざっくり理解】 1標本のt検定を分かりやすく解説
https://qiita.com/JMP_Japan/items/4a924c361206e2b862cd
Statistics Knowledge Portal (t検定)
https://www.jmp.com/ja_jp/statistics-knowledge-portal/t-test.html?utm_campaign=bl&utm_source=JMPblog&utm_medium=social