TL;DR
- 東大の理科3類の男子と女子の合格率の間に統計的に有意(p<0.05)な差はない。
- 鳥取大,島根大医学部の男女の合格率の間にも統計的に有意な差はない。
背景
最近,上野千鶴子氏の東大での式辞が話題になっていて,その中に,以下のような一節があった。
文科省が全国81の医科大・医学部の全数調査を実施したところ、女子学生の入りにくさ、すなわち女子学生の合格率に対する男子学生の合格率は平均1.2倍と出ました。問題の東医大は1.29、最高が順天堂大の1.67、上位には昭和大、日本大、慶応大などの私学が並んでいます。1.0よりも低い、すなわち女子学生の方が入りやすい大学には鳥取大、島根大、徳島大、弘前大などの地方国立大医学部が並んでいます。ちなみに東京大学理科3類は1.03、平均よりは低いですが1.0よりは高い、この数字をどう読み解けばよいでしょうか。統計は大事です、それをもとに考察が成り立つのですから。
合格率の比が1.03というのは,東大理IIIは定員が少ないことを考えると,誤差の範囲内じゃないか?と直感的に疑念を持ったのがきっかけで,具体的に調べてみた。
データ
文部科学省が2018年にまとめた以下のデータ(2013〜2018年度分)を使用。
http://www.gender.go.jp/kaigi/senmon/jyuuten_houshin/sidai/pdf/jyu17-15.pdf
コピペしてCSVに書き出した(以下のファイル)。
https://gist.github.com/nebuta/4a8a9968adc10be3700dbb723c5bf027
統計的検定の方法
2013年度〜2018年度までの6年分を大学ごとに合算して,以下の値を求めた。
- 男女それぞれの合格率の信頼区間
- 男女の合格率の差の95%信頼区間
- 差の信頼区間が0をまたいでいれば有意差なし,いなければ有意差あり。
- カイ二乗検定(帰無仮説:「男女の合格率が等しい」)のp値
- カイ二乗検定でp<0.05であれば,「偶然のせいで男女の合格率が等しくならなかった確率は0.05未満」ということになり,男女の合格率に有意差あり。
計算にはSciPyのstats.chi2_contingency
, stats.binom.interval
および以下のコードを利用した。 https://stackoverflow.com/questions/39239087/
全体のソースコードは以下の通り(殴り書きのため読むづらいです...)
https://gist.github.com/nebuta/fed447861b2e40ee8fcb122ff88b313a
結果
男女の合格率の差を大学ごとに表示した結果が以下のグラフである。
- 真ん中の丸が差の推定値で,バーが95%信頼区間。
- バーが0の完全に右にある場合(青で表示)は,男子の合格率が女子よりも有意に高い(p<0.05)
- バーが0の完全に左にある場合(赤で表示)は,女子の合格率が男子よりも有意に高い(p<0.05)
- それ以外の場合は,有意差なし。
東京大学(理科III類)に関しては,p値0.789で,95%信頼区間が(-0.040, 0.053)である。つまり,男女の合格率に統計的有意差があるとは言えない。
- 鳥取大 p値0.992,95%信頼区間が(-0.023, 0.023)
- 島根大 p値0.658,95%信頼区間が(-0.033, 0.021)
これら2つも男女の合格率に統計的有意差があるとは言えない
注意
- 有意差がないというのは「差があるとはっきりとは言えない」であって「差が無いとはっきり言える」ではない。
- 「入試で男女の合格率に差がない」としても,「入試で男女差別がない」とは言い切れない。
- もし女子のほうが全体として二次試験の点数が良いのであれば,「合格率が同じ」は「同じ点数ならば女子が不利」を意味するため。
- ただ,男女の入試本番における素点に関する客観的データは存在しないと思われるので,これは検証しようがない。
個人的感想
式辞の後半の内容は至極納得感があるだけに,導入部の誤った統計の使い方は研究者としては正確さand/or誠実さに欠けると感じ,残念。