LoginSignup
0
1

More than 3 years have passed since last update.

pandas データの確認あれこれ

Last updated at Posted at 2019-08-02

pandas データの確認

pandas データを指定して抽出・表示させる

参考URL
https://pythondatascience.plavox.info/pandas/%E8%A1%8C%E3%83%BB%E5%88%97%E3%81%AE%E6%8A%BD%E5%87%BA
[] を使って抽出する中身を指定する

df[0:4] # 0~4 件目を出力

ラベルごとのサンプル数の合計を出力する(列毎の合計値を出力する方法)

参考URL
https://deepage.net/features/pandas-sum.html
.sum()関数を使うと合計を出力可能

df.sum() 

axis の話もあったがここでは使わない。ちなみに axis=1 が行の合計。

欠損値の確認方法

参考URL
https://qiita.com/0NE_shoT_/items/8db6d909e8b48adcb203
isnull() で欠損値の確認が出来る。欠損有はture,欠損無しはfalse。

df.isnull()

特徴量の平均値と標準偏差、四分位数を出力させる

平均値

https://deepage.net/features/pandas-mean.html
.mean() 関数を使用すると平均値が出力。更に、列の平均を取りたい場合.mean(axis=0)と書く

df.mean()

標準偏差、四分位数

、、と、ここまで書いて気付いてしまった。。
参考URL
https://deepage.net/features/pandas-describe.html
.describe() という関数が有り、それがこの問題を一発で解決する技だったようです。

df.describe()

めでたしめでたし。( ;∀;)

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1