偏差値とは
一般的な偏差値は50を基準として、平均からどれくらいの差があるかを表した数値です。データを一律に標準偏差10、平均50に変換したときの値です。学力検査の結果を表す学力偏差値とは別に製造業の品質管理にも使われているらしい。Wikiではこのような説明だけど不良品の発生確率はポアソン分布に従うことが多いので製品一つ一つの偏差値は計算していることはないと思います😅
ポアソン分布は二項分布の生起確率Pを極端に小さくしたものと考えたらいいですね
なので、偏差値=学力偏差値と考えてもいいです。今回はこの学力偏差値について取り上げます。学力試験においては残念ながら平均50で標準偏差10といった綺麗なデータではないです。
実際に2022年共通テストの平均・標準偏差を見ていきましょう!
科目 | 平均点 | 標準偏差 |
---|---|---|
国語 | 110.26 | 31.94 |
数学IA | 37.96 | 17.12 |
数学IIB | 43.06 | 17.05 |
物理 | 60.72 | 19.22 |
化学 | 47.63 | 20.28 |
英語R | 61.80 | 20.30 |
全ての科目を入力するのは大変なので、一部を抜粋しました💦
参考資料 予備校英語教師のメモ帳 よびめも ~[2022大学入試] 共通テストの平均点が確定!~
実際に計算してみよう
偏差値は下のような公式で表せる。
t_i=\frac{10(x_i-u_x)}{σ_x}+50
ここで平均と標準偏差は以下のように表せる。
u_x=\frac{1}{N}\sum_{i=1}^{N}x_i
σ_x=\sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i-u_i)^2}
次に最近流行りのChatGPTを使ってランダムな得点(0~100)を10個生成しましょう。
サンプルコードまで表示されてめちゃくちゃ丁寧ですよね! ChatGPTはデータベースを作る際のサンプルデータ生成にも使えます。
ちなみに私は英語学習のため敢えて英語で対話してます。英語の学習にも良いですよ👍
手計算だと面倒臭いですけどエクセルで簡単に計算できます。高校生は手計算して計算力を高めてください💪
偏差値は平均と標本偏差に大きく左右されます。よく偏差値80の高校生とかメディアで取り上げられていますが、
恐らく平均と標本偏差が極端に低いような難しいテストで高得点をとったのと考えられます。
偏差値の公式を見直せばこれは自明ですね
平均が低いのは予想しやすい通り難しい試験と直感でわかります。また、標本偏差は分散の平方根なので、データの散らばり具合を示します。
偏差値80は母集団全体でデータの散らばりが少ない所で頭一つ抜けて得点が高いという意味です。
偏差値○○は上位何%
最後に正規分布を用いて偏差値60,70,80は上位何%に対応するか計算してみましょう。
簡単に標準偏差10,平均50で考える。
正規分布は以下の式で表せる。
f(x)=\frac{1}{\sqrt{2πσ^2}}\exp\bigr(-\frac{(x-u)^2}{2σ^2}\bigr)
標準正規分布(平均0分散1)に適用させるために以下の式を使う。
Z=\frac{X-u}{σ}
t_i=Z \times 10+50
つまり、Z=1,2,3の時と標準正規分布の確率I(z)に対応させれば良い。
z\longrightarrow I(z)=\frac{1}{\sqrt{2π}}\int_{0}^{z}\exp(-\frac{x^2}{2})dx
この確率は下側確率なので注意
I(1.0)=0.3413
よって偏差値60は上位15%
0.5-0.3413=0.1587
偏差値70は上位2.3%
I(2.0)=0.4772
0.5-0.4772=0.0228
偏差値80は上位0.13%
I(3.0)=0.4987
0.5-0.4987=0.0013
実際に標準正規分布表を見て計算してみてください。偏差値って意外と奥が深い!