Rを使ってMLBのデータを解析してみようと思う。ちなみにRは全く使ったことのない初心者。
なので、自分のメモを兼ねて基本的なこともメモしていくと思う
インストールするパッケージ
パッケージの前に
googleでrtoolsと検索し、インストールする。
以下のパッケージをインストールしておいた。何かと便利らしい。
ggplot2 描写ツール
tidyverse
dplyr
devtools
インストール方法は、以下のサイトを参照
https://qiita.com/drafts/18e3df8b173227f263e5/edit
Statcastデータをダウンロードする為のパッケージ
有名なのは
baseballer
statcastr
等がある。今回はpontsuyu氏が作成したパッケージを使用
https://github.com/pontsuyu/statcastr
このパッケージはRstudioのインストールからは検出できないので、コードを打ってインストールする必要がある
githubのコードからインストールするときは以下のように入力するだけ
devtools::install_github("pontsuyu/statcastr")
簡単に動かしてヒストグラムを作成
例として、トラウトの打球を6段階に分けたヒストグラムを作成する。
まずはstatcastrを使って、2020年のMLBのデータを引っ張ってくる。
最後は、csv形式にして保存する。
devtools::install_github("pontsuyu/statcastr") #statcastrをインストール
library("statcastr") #パッケージをアクティブにするライブラリ関数
data <- scrape_statcast("2020-07-23", "2020-09-28") #2020年シーズンのデータをすべて入力
write.csv(data, "C:/Users/ファイルの保存場所/data.csv", row.names=F)
rows.namesは行の見出しを付けるかの設定。T(True)にすると見出しがついてしまう。
https://a-habakiri.hateblo.jp/entry/2016/12/12/222806
また、csvに含まれている情報が何を示しているかは以下URLを確認
https://baseballsavant.mlb.com/csv-docs
#トラウトの打球…を作成
trout<-filter(data,batter==545361) #トラウトのデータを抽出
fig_trout = ggplot(trout, aes(x=launch_speed_angle)) + geom_histogram()
#fig_trout
#aesでx軸に何を描くかを示す
#geom_histogram():描画を行うことを示す
とりあえずのメモということで