##はじめに
自分の備忘を兼ねてまとめました。随時更新(予定)
##Pandasをインポートする
import pandas as pd
SeriesはDataFrameの1つのカラムを指すデータ構造(一次元のデータ構造)
DataFrame内のデータは多数のSeriesの集まり(二次元のデータ構造)
Series
###Seriesを定義する
array型とdict型の2種類.
#array型の定義
animals1 = pd.Series([4, 5, 6, 3], index=['cats', 'dogs', 'birds', 'pigs'])
animals1
#dic型の定義
animals2 = pd.Series({'cats': 4, 'dogs': 5, 'birds': 6, 'pigs': 3})
animals2
##結果はどちらも同様で、以下。
cats 4
dogs 5
birds 6
pigs 3
dtype: int64
###データを取り出す
こちらもarray型とdict型の2種類。
# array型
animals1[1] #5
# dict型
animals1['dogs'] #5
#=> 60
##DataFrame
###DataFrameを定義する
array型とdict型の2種類(Series同様).
#array型
df1 = pd.DataFrame([animals1, animals2], index=['Yuka', 'Mika'])
df1
#outputs
cats dogs birds pigs
Yuka 4 5 6 3
Mika 4 5 6 3
#dict型
df2 = pd.DataFrame({'Yuka': animals1, 'Mika': animals2})
df2
#outputs2
Yuka Mika
cats 4 4
dogs 5 5
birds 6 6
pigs 3 3
DataFrameから値を取り出す
animals1.loc['Mika', :]
#outputs
cats 4
dogs 5
birds 6
pigs 3
Name: Mika, dtype: int64
animals1.loc[:, 'cats']
animals1.cats #上記と同様
#outputs
Yuka 4
Mika 4
Name: cats, dtype: int64
##情報を取得する
###pandas.DataFrame
df.info() #行数・列数などを表示
len(df) #行数を取得
len(df.columns) #列数を取得
df.shape #行数・列数を取得
df.shape[0] #0番目の列に属する行数を取得
df.size #全要素数(サイズ)を取得
###pandas.Series
len(s) #全要素数(サイズ)を取得
s.size #同上
##参考
https://qiita.com/HiromuMasuda0228/items/a7a861796dfeac604f47
https://qiita.com/tonluqclml/items/33b541801dbd12d1bb09
https://note.nkmk.me/python-pandas-len-shape-size/