前提
- macOS 10.14.6
- pipenv 2020.6.2
- mysql 14.14 Distrib 5.7.29
Chadwickのインストール
Chadwick: Software Tools for Game-Level Baseball Data — Chadwick 0.7.2 documentation
chadwickbureau/chadwick: Chadwick tools for manipulating baseball data
DiamondWare形式で記述されているファイルをパースするためのツール。
py-retrosheetが使用するのでインストールしておく。
githubページ上のreleaseから最新のzipファイルをダウンロードして展開。
ターミナル上で操作しコマンドをインストールする。
cd /path/to/chadwick_dir
./configure
make
make install
py-retrosheetの環境構築
wellsoliver/py-retrosheet: Python scripts for Retrosheet parsing
# py-retrosheetをローカルにクローン
git clone git@github.com:wellsoliver/py-retrosheet.git
cd py-retrosheet
# schemaをDBに適用する(予めretrosheetという名前でDBを作っておく)
cd sql
mysql -u root retrosheet -p < schema.sql
# config.iniファイルを作る
cd ../scripts
cp config.ini.dist config.ini
vim config.ini # [database]の項目を自身の環境に合わせて修正
# python2の実行環境と必要なライブラリのインストールを行う
cd ..
pipenv --python 2.7
pipenv install sqlalchemy mysqlclient
retrosheetの情報を登録する
# 欲しい年の情報をmysqlに登録する
cd scripts
pipenv run python download.py -y 2019
pipenv run python parse.py -y 2019