More than 5 years have passed since last update.

groupby後の文字列連結

Last updated at 2019-06-27Posted at 2019-06-27

毎回どうしても忘れてしまうのでメモ。

Dataframe中に入っている特定の列の値（カテゴリ、文字列とか）を、別の列の値でgroupbyした際にカンマ区切りでgroupby後の列に入れる方法。

dfが

である場合に、

df.groupby(‘列A’)

した際に

とする方法↓

df.groupby('列A')[‘列B'].apply(lambda x: "%s" % ','.join(x))

列Bが数字（int,floatなど）であれば lambda式の部分を　

lambda x: "%s" % ','.join(str(x))

にすればＯＫ

追記：下記の方法もあるとコメントもらいました。こっちが見やすくていいですね。

df.groupby('列A')['列B'].agg(','.join)