More than 5 years have passed since last update.

【R】M-1王者ミルクボーイは本当におもしろいのかを一元配置分散分析で調べてみた

Last updated at 2020-01-27Posted at 2020-01-25

ミルクボーイは本当におもしろい？

今更ながらですが、M-1グランプリ2019を見ました。ミルクボーイ優勝おめでとうございます。すごく面白かったです。

ただ毎年M-1グランプリを見ていて思うのですが、結構審査員の好みによって結構点数にばらつきが出ているように思うんですよね。2019年で言えば、からし蓮根とかはすごい上沼恵美子にプッシュされてましたし。~~逆に和牛はものすごい上沼恵美子に嫌われてましたし。~~

気になっているのは、審査員の好みによるばらつきを考慮しても、平均得点に有意な差があるのかということです。そこで今回は、M-1グランプリ2019の決勝戦の結果を使って統計学的に有意な差が現れるのかを調べてみたいと思います。

3組以上のコンビの平均得点の差を比較するため、一元配置分散分析を使うことになります。より詳しくいえば、各コンビについて、各審査員ごとに得点を対応付けることができるため、対応ありの一元配置分散分析を適用して分析を行います。

ちなみに、メインで参考にしているのは次の本です。(統計学初心者にもわかりやすくておすすめです。)

Rによるやさしい統計学

一元配置分散分析による分析

それでは早速分析をしてみましょう。まずはデータの読み込みから始めます。データはM-1グランプリ公式サイトに上がっている決勝結果をそのまま使うことにします。

M-1グランプリ公式サイト

# ライブラリの読み込み
library(tidyverse)
library(magrittr)

# データの読み込み
table_point <- read_tsv("
コンビ名	オール巨人	ナイツ・塙宣之	立川志らく	サンドウィッチマン・富澤たけし	中川家・礼二	松本人志	上沼恵美子	総合得点
ミルクボーイ	97	99	97	97	96	97	98	681
かまいたち	93	95	95	93	94	95	95	660
ぺこぱ	93	94	91	94	92	94	96	654
和牛	92	96	96	91	93	92	92	652
見取り図	94	92	94	91	93	91	94	649
からし蓮根	93	90	89	90	93	90	94	639
オズワルド	91	89	89	91	94	90	94	638
すゑひろがりず	92	91	92	90	91	89	92	637
インディアンス	92	89	87	90	92	88	94	632
ニューヨーク	87	91	90	88	88	82	90	616
")

# データの整形
table_point2 <-
  table_point %>% 
  select(-総合得点) %>% 
  #横持ちを縦持ちに変換
  gather(key = 審査員, value = 得点, -コンビ名) %>% 
  # character型をfactor型へ変換
  mutate(
    コンビ名 = コンビ名 %>% as.factor,
    審査員 = 審査員 %>% as.factor
  )

# 分散分析の実行
table_point2 %$% aov(得点 ~ コンビ名 + 審査員) %>% summary

#             Df Sum Sq Mean Sq F value   Pr(>F)    
# コンビ名     9  402.8   44.76  15.552 3.94e-12 ***
# 審査員       6   57.2    9.53   3.311  0.00755 ** 
# Residuals   54  155.4    2.88                     
# ---
# Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

さて、結果についてですが、今回はコンビの違いによる平均得点の差を検定したかったので、「コンビ名」の行に注目することになります。p値を見てみるとp = 3.94e-12なので、5%水準でコンビ間の平均得点に有意な差があるということが結論付けられます。

多重比較(Holmの方法)

さて、ここまでの分析で分かったのは「5%水準で各コンビの得点の母平均は等しくない」ということであって、具体的にどのコンビとどのコンビの間に差があるかまでは分かりません。そのため、コンビ間の平均得点の有意差を調べるために多重比較を行うことにします。

「Rによるやさしい統計学」では多重比較としてTukeyの方法が紹介されていますが、以下サイトによるとTukeyの方法は「対応あり」のデータに適用するのは問題があると指摘されているとのことなので、代わりにHolmの方法を使って多重比較を行いたいと思います。

参考：R言語で統計解析入門対応のある３群以上の平均値の差の検定--分散分析

# Holmの方法で多重比較を実行
table_point2 %$% pairwise.t.test(得点 , コンビ名, p.adjust.method="holm", paired=TRUE )

# 	Pairwise comparisons using paired t tests 
# 
# data:  得点 and コンビ名 
# 
#                インディアンス オズワルド かまいたち からし蓮根 すゑひろがりず ニューヨーク ぺこぱ  ミルクボーイ 見取り図
# オズワルド     1.00000        -          -          -          -              -            -       -            -       
# かまいたち     0.33167        0.41377    -          -          -              -            -       -            -       
# からし蓮根     0.44197        1.00000    0.41377    -          -              -            -       -            -       
# すゑひろがりず 1.00000        1.00000    0.03991    1.00000    -              -            -       -            -       
# ニューヨーク   1.00000        1.00000    0.05289    0.81569    0.38788        -            -       -            -       
# ぺこぱ         0.27169        0.69034    1.00000    0.69034    0.58393        0.18543      -       -            -       
# ミルクボーイ   0.01825        0.02931    0.00893    0.01823    0.00089        0.00417      0.01119 -            -       
# 見取り図       0.69034        1.00000    0.80540    1.00000    0.00386        0.10142      1.00000 0.01644      -       
# 和牛           1.00000        1.00000    1.00000    1.00000    0.62482        0.05775      1.00000 0.03863      1.00000

この結果をまとめると、5%水準で

ミルクボーイはすべてのコンビより平均得点に有意な差がある
かまいたちと見取り図は、すゑひろがりずと比べて平均得点に有意な差がある
その他のコンビ間の平均得点に有意な差はない

と結論付けられそうです。

まとめ

こうやって分析してみると、M-1グランプリではミルクボーイが圧勝だったんだなと改めて思います。その他のコンビについても、どのコンビがファイナルラウンドに残ってもおかしくはないみたいですね。~~ただし、すゑひろがりずは除く~~

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up