ミルクボーイは本当におもしろい?
今更ながらですが、M-1グランプリ2019を見ました。ミルクボーイ優勝おめでとうございます。すごく面白かったです。
ただ毎年M-1グランプリを見ていて思うのですが、結構審査員の好みによって結構点数にばらつきが出ているように思うんですよね。2019年で言えば、からし蓮根とかはすごい上沼恵美子にプッシュされてましたし。逆に和牛はものすごい上沼恵美子に嫌われてましたし。
気になっているのは、審査員の好みによるばらつきを考慮しても、平均得点に有意な差があるのかということです。そこで今回は、M-1グランプリ2019の決勝戦の結果を使って統計学的に有意な差が現れるのかを調べてみたいと思います。
3組以上のコンビの平均得点の差を比較するため、一元配置分散分析を使うことになります。より詳しくいえば、各コンビについて、各審査員ごとに得点を対応付けることができるため、対応ありの一元配置分散分析を適用して分析を行います。
ちなみに、メインで参考にしているのは次の本です。(統計学初心者にもわかりやすくておすすめです。)
一元配置分散分析による分析
それでは早速分析をしてみましょう。まずはデータの読み込みから始めます。データはM-1グランプリ公式サイトに上がっている決勝結果をそのまま使うことにします。
# ライブラリの読み込み
library(tidyverse)
library(magrittr)
# データの読み込み
table_point <- read_tsv("
コンビ名 オール巨人 ナイツ・塙宣之 立川志らく サンドウィッチマン・富澤たけし 中川家・礼二 松本人志 上沼恵美子 総合得点
ミルクボーイ 97 99 97 97 96 97 98 681
かまいたち 93 95 95 93 94 95 95 660
ぺこぱ 93 94 91 94 92 94 96 654
和牛 92 96 96 91 93 92 92 652
見取り図 94 92 94 91 93 91 94 649
からし蓮根 93 90 89 90 93 90 94 639
オズワルド 91 89 89 91 94 90 94 638
すゑひろがりず 92 91 92 90 91 89 92 637
インディアンス 92 89 87 90 92 88 94 632
ニューヨーク 87 91 90 88 88 82 90 616
")
# データの整形
table_point2 <-
table_point %>%
select(-総合得点) %>%
#横持ちを縦持ちに変換
gather(key = 審査員, value = 得点, -コンビ名) %>%
# character型をfactor型へ変換
mutate(
コンビ名 = コンビ名 %>% as.factor,
審査員 = 審査員 %>% as.factor
)
# 分散分析の実行
table_point2 %$% aov(得点 ~ コンビ名 + 審査員) %>% summary
# Df Sum Sq Mean Sq F value Pr(>F)
# コンビ名 9 402.8 44.76 15.552 3.94e-12 ***
# 審査員 6 57.2 9.53 3.311 0.00755 **
# Residuals 54 155.4 2.88
# ---
# Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
さて、結果についてですが、今回はコンビの違いによる平均得点の差を検定したかったので、「コンビ名」の行に注目することになります。p値を見てみるとp = 3.94e-12
なので、5%水準でコンビ間の平均得点に有意な差があるということが結論付けられます。
多重比較(Holmの方法)
さて、ここまでの分析で分かったのは「5%水準で各コンビの得点の母平均は等しくない」ということであって、具体的にどのコンビとどのコンビの間に差があるかまでは分かりません。そのため、コンビ間の平均得点の有意差を調べるために多重比較を行うことにします。
「Rによるやさしい統計学」では多重比較としてTukeyの方法が紹介されていますが、以下サイトによるとTukeyの方法は「対応あり」のデータに適用するのは問題があると指摘されているとのことなので、代わりにHolmの方法を使って多重比較を行いたいと思います。
参考:R言語で統計解析入門 対応のある3群以上の平均値の差の検定--分散分析
# Holmの方法で多重比較を実行
table_point2 %$% pairwise.t.test(得点 , コンビ名, p.adjust.method="holm", paired=TRUE )
# Pairwise comparisons using paired t tests
#
# data: 得点 and コンビ名
#
# インディアンス オズワルド かまいたち からし蓮根 すゑひろがりず ニューヨーク ぺこぱ ミルクボーイ 見取り図
# オズワルド 1.00000 - - - - - - - -
# かまいたち 0.33167 0.41377 - - - - - - -
# からし蓮根 0.44197 1.00000 0.41377 - - - - - -
# すゑひろがりず 1.00000 1.00000 0.03991 1.00000 - - - - -
# ニューヨーク 1.00000 1.00000 0.05289 0.81569 0.38788 - - - -
# ぺこぱ 0.27169 0.69034 1.00000 0.69034 0.58393 0.18543 - - -
# ミルクボーイ 0.01825 0.02931 0.00893 0.01823 0.00089 0.00417 0.01119 - -
# 見取り図 0.69034 1.00000 0.80540 1.00000 0.00386 0.10142 1.00000 0.01644 -
# 和牛 1.00000 1.00000 1.00000 1.00000 0.62482 0.05775 1.00000 0.03863 1.00000
この結果をまとめると、5%水準で
- ミルクボーイはすべてのコンビより平均得点に有意な差がある
- かまいたちと見取り図は、すゑひろがりずと比べて平均得点に有意な差がある
- その他のコンビ間の平均得点に有意な差はない
と結論付けられそうです。
まとめ
こうやって分析してみると、M-1グランプリではミルクボーイが圧勝だったんだなと改めて思います。その他のコンビについても、どのコンビがファイナルラウンドに残ってもおかしくはないみたいですね。ただし、すゑひろがりずは除く