はじめに
PandasのDataFrameを使っていて、特定の列の値を使って計算を行い
新たに列方向に項目を追加し、ここに計算した値を設定する方法まとめた
データは下記のものを扱う
やること
seasonConceded_home:ホーム失点数(h)
seasonConceded_away:アウェイ失点数(a)
lostPoint:総失点数(p)
(項目名は括弧書きの文字列で表記しています)
print(df)
a h
0 11 12
1 12 10
2 27 12
上記のようなデータがある場合、このようにp列を追加し、hとa列の合計値を設定する
print(df)
a h p
0 11 12 23
1 12 10 22
2 27 12 39
コード
import pandas as pd
# dfに必要なデータが入っている
df['lostPoint'] = df['seasonConceded_away'] + df['seasonConceded_home']
右辺でDataFrameから列の値をそれぞれ取り出し、加算の処理を行う
加算した値を新たな列名を宣言し、ここに格納する
備考
サンプルAPIのレスポンスパラメータを見ると
"seasonConceded_away"と"seasonConceded_home"の合計した値が
"seasonConceded"と異なっているので計算してDataFrameに入れ直すハメになりました
計算方法をググって理解して、記事にしました。