順位係数って何ぞや
二つのデータ(変量)が数値でなく順位で与えられている場合があります.例えば,
- 学習の習熟度
- 病気の重症度
- 好みの程度
などがありますね.
A | $a_1$ | $a_2$ | $\cdots$ | $a_N$ |
---|---|---|---|---|
B | $b_1$ | $b_2$ | $\cdots$ | $b_N$ |
$a_1,a_2,\cdots,a_N$,$b_1,b_2,\cdots,b_N$は$1$から$N$までの値となり,同順位は含まないとします.この時,
\begin{equation}
r_s=1-\frac{6[(a_1-b_1)^2+(a_2-b_2)^2+\cdots+(a_N-b_N)^2]}{N(N^2-1)}
\end{equation}
のことをスピアマンの順位相関係数(Spearman's rank correlation coefficient)と呼んでいます.
具体例
ある学校の10人の学生について,「手の器用さの順位」と「コンピューターの習熟度の順位」について調べました(表).
サンプル | $1$ | $2$ | $3$ | $4$ | $5$ | $6$ | $7$ | $8$ | $9$ | $10$ |
---|---|---|---|---|---|---|---|---|---|---|
手の器用さ | $5$ | $6$ | $9$ | $3$ | $2$ | $4$ | $8$ | $10$ | $7$ | $1$ |
コンピューターの 習熟度 |
$7$ | $5$ | $6$ | $3$ | $4$ | $1$ | $8$ | $9$ | $10$ | $2$ |
スピアマンの順位相関係数を求めてみましょう.計算を簡単にするために,次の様な表を作成します.
サンプル | $1$ | $2$ | $3$ | $4$ | $5$ | $6$ | $7$ | $8$ | $9$ | $10$ |
---|---|---|---|---|---|---|---|---|---|---|
$a_i$ | $5$ | $6$ | $9$ | $3$ | $2$ | $4$ | $8$ | $10$ | $7$ | $1$ |
$b_i$ | $7$ | $5$ | $6$ | $3$ | $4$ | $1$ | $8$ | $9$ | $10$ | $2$ |
$a_i-b_i$ | $-2$ | $1$ | $3$ | $0$ | $-2$ | $3$ | $0$ | $1$ | $-3$ | $1$ |
$(a_i-b_i)^2$ | $4$ | $1$ | $9$ | $0$ | $4$ | $9$ | $0$ | $1$ | $9$ | $1$ |
したがって,
\begin{equation}
r_s=1-\frac{6\times(4+1+9+0+4+9+0+1+9+1)}{10\times(10^2-1)}=0.7697
\end{equation}
となり,「手の器用さ」と「コンピューターの習熟度」には正の相関があることが分かりました.
参考
石村貞夫,"統計解析のはなし",東京図書,1989年