More than 5 years have passed since last update.

Pandas備忘録

Last updated at 2017-11-09Posted at 2017-11-06

データの読み込み(CSVファイル)

import pandas as pd
file = pd.read_csv("FileName.csv")

＊データが列の名前に組み込まれたとき＊
file = pd.read_csv("FileName.csv",header=None)

データ行列の形を知ることができる
＊shapeは関数じゃないから.shape()としない（アトリビュート？とかいうやつっぽい）＊

先頭から5行を取得

＊引数に数字を入れることで表示される行数を指定できる＊
先頭から7行取得

末尾から5行を取得

＊引数に数字を入れることで表示される行数を指定できる＊
末尾から7行取得

基本統計量の確認ができる

カラムごとの情報を確認できる

test["A"].mean()
こんな感じで記述してカラムAの要素の平均値が出せる

test["A"].median()
こんな感じで記述してカラムAの要素の中央値が出せる

test[test["おすし"]=="まぐろ"].sort_values(by="金額")
こんな感じで書くと、データフレームtestの"おすし"カラム中の"まぐろ"要素を抜き出して、"金額"で昇順ソートする

test[test["おすし"]=="まぐろ"].sort_values(by="金額")
こんな感じで書くと、データフレームtestの"おすし"カラム中の"まぐろ"要素を抜き出して、"金額"で降順ソートする