概要
サッカーJリーグの2017年から2019年シーズン成績のcsvを
pandas.DataFrameで読み込んだものを条件指定で絞り込む
前提
1.絞り込みたいcsvデータを所定のパスに配置していること
2.Python、pandasの環境構築が済んでいること
過去の記事からの流れの記事です
過去記事:https://qiita.com/wooooo/items/ab55104b4ae031291a62
(こちらに対象のCSVデータについてリンクがあります)
実装編
analysis.py
# -*= encoding: utf-8 -*-
import pandas as pd
# csvファイルのパス(任意)
csv_path = '/Users/app/csv/J. League Data Site.csv'
# csvファイルを読み込む
data = pd.read_csv(csv_path)
# 出力
print(data)
このように、"Year"や"Result_Home"など項目があります。
csvファイルを見ると、"Home"、"Away"というホーム・アウェイ側のチーム名の項目があるので
「川崎フロンターレのホーム」側のデータを出力してみます
analysis.py
# 川崎フロンターレで絞り込み
print(data.query('Home == "Kawasaki-F"'))
csvには複数の項目があるので
続いて、「2017年」の「川崎フロンターレのホーム」側のデータを出力してみます
analysis.py
# 2017年の川崎フロンターレで絞り込み
print(data.query('Home == "Kawasaki-F" & Year == 2017'))
2017年から2019年の3年分から2017年だけの
川崎フロンターレがホームの成績だけに絞り込めました
analysis.py
# 2017年の川崎フロンターレのホームの1試合平均
print(data.query('Home == "Kawasaki-F" & Year == 2017').mean())
ソースコード全体
analysis.py
# -*= encoding: utf-8 -*-
import pandas as pd
# csvファイルのパス(任意)
csv_path = '/Users/app/csv/J. League Data Site.csv'
# csvファイルを読み込む
data = pd.read_csv(csv_path)
# 2017年の川崎フロンターレのホームの1試合平均
print(data.query('Home == "Kawasaki-F" & Year == 2017').mean())
今回はcsvをpandas.read_csvで読み込んだDataFormatを
絞り込む方法を記事にしました
その他、pandasで学んだことを記事にしていきます!