More than 5 years have passed since last update.

pandas.groupby 超簡単なチートシートっぽいもの（自分用）

Last updated at 2019-05-11Posted at 2019-05-11

pandasのgroupbyがなかなか便利だったのでチートシートっぽいものを作っておく。
ほぼ自分用のメモ。

参考にさせていただいたサイトなど

詳しいことは下記のリンクを参照

python 3.7.2
pandas 0.23.4

データはseabornのirisを使ってみる。

qiit.rb

import pandas as pd
import seaboan as sns
df = sns.load_dataset('iris')

species別にどれだけデータが入っているか？

qiit.rb

df.groupby('species').size()

.indexでグループのリストも取得できる。

qiit.rb

GroupList = df.groupby('species').size().index

各グループの平均とか
データフレームに対してだとデータフレームの各列の平均とかのデータフレームが返ってくる。

qiit.rb


df.groupby('species').mean()

データフレームのある列（シリーズ）に対してなら下記

qiit.rb

df.groupby('species').mean()['sepal_length']

.aggを使う。

qiit.rb


df.groupby('species').agg(np.nanmean)

df.groupby('species').agg(np.nanmean)['sepal_length']

.aggは自作関数もOKみたい。

qiit.rb

def TEST_DEF(DF):
    DF_MAX = DF.max()
    DF_MIN = DF.min()
    return DF_MAX - DF_MIN

df.groupby('species').agg(TEST_DEF)

他にも気が向いたら更新していく予定。