pandas データの確認
pandas データを指定して抽出・表示させる
参考URL
https://pythondatascience.plavox.info/pandas/%E8%A1%8C%E3%83%BB%E5%88%97%E3%81%AE%E6%8A%BD%E5%87%BA
[] を使って抽出する中身を指定する
df[0:4] # 0~4 件目を出力
ラベルごとのサンプル数の合計を出力する(列毎の合計値を出力する方法)
参考URL
https://deepage.net/features/pandas-sum.html
.sum()関数を使うと合計を出力可能
df.sum()
axis の話もあったがここでは使わない。ちなみに axis=1 が行の合計。
欠損値の確認方法
参考URL
https://qiita.com/0NE_shoT_/items/8db6d909e8b48adcb203
isnull() で欠損値の確認が出来る。欠損有はture,欠損無しはfalse。
df.isnull()
特徴量の平均値と標準偏差、四分位数を出力させる
平均値
https://deepage.net/features/pandas-mean.html
.mean() 関数を使用すると平均値が出力。更に、列の平均を取りたい場合.mean(axis=0)と書く
df.mean()
標準偏差、四分位数
、、と、ここまで書いて気付いてしまった。。
参考URL
https://deepage.net/features/pandas-describe.html
.describe() という関数が有り、それがこの問題を一発で解決する技だったようです。
df.describe()