More than 3 years have passed since last update.

Pandasのデータフレーム。「ある値」以下の値が存在する列のみを抽出したい

Last updated at 2021-12-21Posted at 2021-12-21

何度も忘れ、無駄に検索を繰返してしまう処理を備忘録として記載する。
（ここで df は pandas.DataFrame）

１、「ある値未満の値が存在する列のみを抽出したい」場合

例えばある値を１００として、１００未満の値を含む列だけを抽出したい場合、
condition = df < 100とおいて、

condition = df < 100
df.loc[:, condition.any(axis=0)]

(any()が簡便とご指摘いただき　~~(~df[condition].isnull()).sum() != 0~~ を削除しました。）
(※ 返り値がデータフレームとなる条件式が .any()でなぜ処理できるのか疑問でしたが、.any() は axis 引数を省略可能でデフォルトが .any(axis=0) であるとのこと。https://estuarine.jp/2017/09/extract_rows_with_nan/ ）

列中のすべての行が（表計算ソフトで言うところのすべてのセルが）、１００未満の列のみを抽出したい場合は以下のように書く。
~~df.loc[:, df[condition].isnull().sum() == 0]~~

df.loc[:, condition.all(axis=0)]

２、「ある値より大きい値が存在する列のみを抽出したい」場合

不等号の向きを変えて、condition = df > 100とします。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

Pandasのデータフレーム。「ある値」以下の値が存在する列のみ を抽出したい

１、「ある値未満の値が存在する列のみを抽出したい」場合

２、「ある値より大きい値が存在する列のみを抽出したい」場合

Pandasのデータフレーム。「ある値」以下の値が存在する列のみを抽出したい