はじめに
大学で機械学習を勉強しています。復習もかねてPandas100本ノックに挑戦させていただきました。
使った関数?をまとめていきたいと思います。
Pandas100本ノック
詳細はこちら
Python初学者のためのPandas100本ノック
Pandas基礎(1 ~ 13)
#1 DataFrameの最初の5行を表示
df.head()
####表示させたい行数を指定する場合
例:10行
df.head(10)
#2 最後の5行を表示
df.tail()
#5 dfの'fare'を昇順に並べ替えして表示
df.sort_values('fare')
ascending=Falseを指定することで降順で並べ替え
データ抽出(14 ~ 32)
#18 locを使ってdf全体を表示
df.loc[:,:]
#20 locを使ってdfのfare列の10行目まで表示
df.loc[:10, 'fare']
#25 dfのage列の値が30以上のデータのみ抽出
df[df['age'] >= 30]
#27 dfのsex列がfemaleでかつageが40以上のデータのみ抽出
df[(df['sex'] == "female") & (df['age'] >= 40)]
#28 queryを用いてdfのsex列がfemaleでかつageが40以上のデータのみ抽出
df.query('sex == "female" & age >= 40')
#29 dfのname列に文字列「Mrs」が含まれるデータを表示
df.query('name.str.contains("Mrs")', engine='Python')
#30 dfの中で文字型の列のみを表示
df.select_dtypes(include='object')
#31 dfの各列の要素数の確認
df.nunique()
#32 dfのembarked列の要素と出現回数の確認
df['embarked'].value_counts()
途中までやってみた感想
そこそこPandasに慣れてきた感覚はあったけど、やってみてその自信はボキッと折られました...
いい復習になるので慣れている人もぜひやってみてください。
queryめっちゃ便利...