今回は野手のデータを見てみます。
野手についてもプロ野球データフリークからコツコツ集めてエクセルファイルにまとめましたのでダウンロードして使ってみてください。
library(openxlsx)
datH<-read.xlsx("C:/Users/ユーザー名/Downloads/hitter_data.xlsx",sheet="Sheet1")
head(datH)
> head(datH)
選手名 生年月日 投打 投 打 守備 出身地 身長 血液型 体重
1 栗原健太(くりはらけんた) 29959 右投右打 右 右 内野手 山形 183 O 95
2 東出輝裕(ひがしであきひろ) 29454 右投左打 右 左 内野手 福井 171 A 73
3 嶋重宣(しましげのぶ) 27927 左投左打 左 左 外野手 埼玉 181 A 95
4 石原慶幸(いしはらよしゆき) 29105 右投右打 右 右 捕手 岐阜 177 A 82
5 緒方孝市(おがたこういち) 25197 右投右打 右 右 外野手 佐賀 181 A 80
6 フィリップス(あんでぃふぃりっぷす) 28221 右投右打 右 右 内野手 アメリカ 183 不明 93
年俸 年度 リーグ 球団 試合数 打席数 打数 得点 安打 二塁打 三塁打 本塁打 塁打 打点
1 13000 2009 セリーグ 広島東洋 140 582 521 68 134 21 0 23 224 79
2 10000 2009 セリーグ 広島東洋 142 625 558 71 164 16 8 0 196 26
3 5500 2009 セリーグ 広島東洋 89 198 175 12 40 9 0 2 55 17
4 5000 2009 セリーグ 広島東洋 124 422 364 31 75 15 1 10 122 37
5 4500 2009 セリーグ 広島東洋 53 60 49 2 9 1 1 0 12 7
6 4000 2009 セリーグ 広島東洋 74 301 264 35 70 15 1 15 132 50
盗塁 盗塁刺 犠打 犠飛 四球 死球 三振 併殺打 打率 出塁率 長打率 OPS
1 1 6 0 2 48 7 82 11 0.257 0.327 0.430 0.757
2 14 7 19 3 44 1 39 5 0.294 0.345 0.351 0.696
3 3 1 0 5 15 3 34 7 0.229 0.293 0.314 0.607
4 2 3 11 4 39 4 90 11 0.206 0.287 0.335 0.622
5 2 0 0 1 9 1 2 0 0.184 0.317 0.245 0.562
6 0 0 0 5 27 5 48 7 0.265 0.339 0.500 0.839
スタッツが少ないので追加します。
library(tidyverse)
datH2<-datH %>%
mutate(単打=安打-二塁打-三塁打-本塁打) %>%
mutate(RC=((安打+四球)*塁打)/(打数+四球)) %>%
mutate(wOBA=(0.9*単打+1.3*二塁打+1.6*三塁打+2.0*本塁打+0.7*(四球+死球))/(打数+四球+死球+犠飛)) %>%
mutate(wRAA=0.44*単打+0.77*二塁打+1.12*三塁打+1.41*本塁打+0.29*四球+0.3*死球-0.25*(打数-安打))
投手と同じく野手も人数が多いので2つに分けます。
datH3<-datH2 %>%
filter(球団=="広島東洋") %>%
filter(選手名=="菊池涼介(きくちりょうすけ)"|選手名=="丸佳浩(まるよしひろ)"|選手名=="田中広輔(たなかこうすけ)"|選手名=="鈴木誠也(すずきせいや)"|選手名=="松山竜平(まつやまりゅうへい)"|選手名=="安部友裕(あべともひろ)"|選手名=="會澤翼(あいざわつばさ)"|選手名=="新井貴浩(あらいたかひろ)"|選手名=="野間峻祥(のまたかよし)"|選手名=="堂林翔太(どうばやししょうた)")
datH4<-datH2 %>%
filter(球団=="広島東洋") %>%
filter(選手名=="栗原健太(くりはらけんた)"|選手名=="梵英心(そよぎえいしん)"|選手名=="廣瀬純(ひろせじゅん)"|選手名=="前田智徳(まえだとものり)"|選手名=="赤松真人(あかまつまさと)"|選手名=="小窪哲也(こくぼてつや)"|選手名=="エルドレッド(ブラッドエルドレッド)"|選手名=="下水流昂(しもずるこう)"|選手名=="磯村嘉孝(いそむらよしたか)"|選手名=="上本崇司(うえもとたかし)")
datH5<-datH2 %>%
filter(球団=="広島東洋") %>%
filter(選手名=="西川龍馬(にしかわりょうま)"|選手名=="坂倉将吾(さかくらしょうご)"|選手名=="小園海斗(こぞのかいと)"|選手名=="曽根海成(そねかいせい)"|選手名=="羽月隆太郎(はつきりゅうたろう)"|選手名=="末包昇大(すえかねしょうた)"|選手名=="大盛穂(おおもりみのる)"|選手名=="林晃汰(はやしこうた)"|選手名=="矢野雅哉(やのまさや)"|選手名=="バティスタ(サビエルバティスタ)")
まずはOPSから。
ggplot(data=datH3,mapping=aes(x=as.factor(年度),y=OPS,group=選手名,colour=選手名))+
geom_point(size=2,shape=21)+geom_line(size=1.5)+labs(x="年度",y="OPS")+scale_colour_brewer(palette="Paired")+scale_fill_brewer(palette="Paired")+theme_bw()
ggplot(data=datH4,mapping=aes(x=as.factor(年度),y=OPS,group=選手名,colour=選手名))+
geom_point(size=2,shape=21)+geom_line(size=1.5)+labs(x="年度",y="OPS")+scale_colour_brewer(palette="Paired")+scale_fill_brewer(palette="Paired")+theme_bw()
ggplot(data=datH5,mapping=aes(x=as.factor(年度),y=OPS,group=選手名,colour=選手名))+
geom_point(size=2,shape=21)+geom_line(size=1.5)+labs(x="年度",y="OPS")+scale_colour_brewer(palette="Paired")+scale_fill_brewer(palette="Paired")+theme_bw()
2018年はOPS1.0越えが2人もいたんですねえ。
そりぁあこの2人が抜けたダメージは果てしなく大きいわけです。
會澤、松山はもう大分下降線をたどってますね。今年はどんな起用をされるのか注目です。
西川、坂倉も0.75あたりでそこそこいい成績ですが、ちょっと頭打ち感がありますね。
末包は西川より上なんですね。今年はもう一段階進化を期待したいです。
次はwOBAです。
ggplot(data=datH3,mapping=aes(x=as.factor(年度),y=wOBA,group=選手名,colour=選手名))+
geom_point(size=2,shape=21)+geom_line(size=1.5)+labs(x="年度",y="wOBA")+scale_colour_brewer(palette="Paired")+scale_fill_brewer(palette="Paired")+theme_bw()
ggplot(data=datH4,mapping=aes(x=as.factor(年度),y=wOBA,group=選手名,colour=選手名))+
geom_point(size=2,shape=21)+geom_line(size=1.5)+labs(x="年度",y="wOBA")+scale_colour_brewer(palette="Paired")+scale_fill_brewer(palette="Paired")+theme_bw()
ggplot(data=datH5,mapping=aes(x=as.factor(年度),y=wOBA,group=選手名,colour=選手名))+
geom_point(size=2,shape=21)+geom_line(size=1.5)+labs(x="年度",y="wOBA")+scale_colour_brewer(palette="Paired")+scale_fill_brewer(palette="Paired")+theme_bw()
こちらはほとんどOPSと同じですね。
次は打撃得点(wRAA)です。
wRAA=0.44*単打+0.77*二塁打+1.12*三塁打+1.41*本塁打+0.29*四球+0.3*死球-0.25*(打数-安打)
打撃得点は同じ打席数をリーグの平均的な打者が打つ場合に比べてどれだけチームの得点を増やしたかを表す指標です。
定義上、平均的な打者であればプラマイゼロになります。20あれば主軸を任せられる打者で、40あればリーグを代表する打者になります。
ggplot(data=datH3,mapping=aes(x=as.factor(年度),y=wRAA,group=選手名,colour=選手名))+
geom_point(size=2,shape=21)+geom_line(size=1.5)+labs(x="年度",y="wRAA")+scale_colour_brewer(palette="Paired")+scale_fill_brewer(palette="Paired")+theme_bw()
ggplot(data=datH4,mapping=aes(x=as.factor(年度),y=wRAA,group=選手名,colour=選手名))+
geom_point(size=2,shape=21)+geom_line(size=1.5)+labs(x="年度",y="wRAA")+scale_colour_brewer(palette="Paired")+scale_fill_brewer(palette="Paired")+theme_bw()
ggplot(data=datH5,mapping=aes(x=as.factor(年度),y=wRAA,group=選手名,colour=選手名))+
geom_point(size=2,shape=21)+geom_line(size=1.5)+labs(x="年度",y="wRAA")+scale_colour_brewer(palette="Paired")+scale_fill_brewer(palette="Paired")+theme_bw()
確かに3連覇のころの主軸は高い値になってますね。
逆をいうとこれくらいのメンバーが揃わないとない厳しいのか~とも思ってしまいますが、近年の投高打低の傾向を踏まえると、本来はここ数年のメンバーの値ももう少し高くてもいいのかなと思います。