LoginSignup
1
1

More than 3 years have passed since last update.

PandasのSeriesとDataFrame基礎(随時更新予定)

Posted at

はじめに

自分の備忘を兼ねてまとめました。随時更新(予定)

Pandasをインポートする

import pandas as pd

SeriesはDataFrameの1つのカラムを指すデータ構造(一次元のデータ構造)
DataFrame内のデータは多数のSeriesの集まり(二次元のデータ構造)

Series

Seriesを定義する

array型とdict型の2種類.

#array型の定義
animals1 = pd.Series([4, 5, 6, 3], index=['cats', 'dogs', 'birds', 'pigs'])
animals1

#dic型の定義
animals2 = pd.Series({'cats': 4, 'dogs': 5, 'birds': 6, 'pigs': 3})
animals2

##結果はどちらも同様で、以下。
cats  4
dogs  5
birds 6
pigs  3
dtype: int64

データを取り出す

こちらもarray型とdict型の2種類。

# array型
animals1[1] #5

# dict型
animals1['dogs'] #5

#=> 60

DataFrame

DataFrameを定義する

array型とdict型の2種類(Series同様).

#array型
df1 = pd.DataFrame([animals1, animals2], index=['Yuka', 'Mika'])
df1
#outputs
      cats   dogs   birds  pigs
Yuka   4      5      6      3
Mika   4      5      6      3


#dict型
df2 = pd.DataFrame({'Yuka': animals1, 'Mika': animals2})
df2
#outputs2
      Yuka Mika
cats   4    4
dogs   5    5
birds  6    6
pigs   3    3

DataFrameから値を取り出す



animals1.loc['Mika', :]
#outputs
cats   4    
dogs   5    
birds  6    
pigs   3    
Name: Mika, dtype: int64

animals1.loc[:, 'cats']
animals1.cats #上記と同様
#outputs
Yuka  4
Mika  4
Name: cats, dtype: int64

情報を取得する

pandas.DataFrame

df.info() #行数・列数などを表示

len(df) #行数を取得
len(df.columns) #列数を取得

df.shape #行数・列数を取得
df.shape[0] #0番目の列に属する行数を取得

df.size #全要素数(サイズ)を取得

pandas.Series

len(s) #全要素数(サイズ)を取得
s.size #同上

参考

https://qiita.com/HiromuMasuda0228/items/a7a861796dfeac604f47
https://qiita.com/tonluqclml/items/33b541801dbd12d1bb09
https://note.nkmk.me/python-pandas-len-shape-size/

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1