公式ドキュメンテーションにまとめられているアトリビュート、メソッドを日本語でまとめる。
公式ドキュメント: https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.html
基本書式
pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)
引数
data=None
numpyのndarrayオブジェクト、python dictionary、Dataframeをとる。
ただしdictionaryはSeries、array、定数、リストライクなオブジェクトで構成されているものを受け付けることができる。それぞれの要素がDataFrameの箱の中に入れられると考えれば良い。
index=None
arrayライクまたはIndexオブジェクトをとる。デフォルトではnp.arrange(n)をとる。
データフレームのindex付けに使われる。
columns=None
arrayライクまたはIndexオブジェクトをとる。デフォルトではnp.arrange(n)をとる。
データフレームcoluimnの名前付けに使われる。
dtype=None
dtypeオブジェクトをとる。
データの方を強制する時に使う。一種類の方のみ受け付けることに注意。特に指定しない場合、推論される。
copy=False
論理値をとる。デフォルトはFalse
入力されたデータをコピーする。これがDataframeまたは2次元のndarrayのみ効果がある。
(ドキュメンテーションの直訳。効果のほどはよくわからない。)
アトリビュート一覧
よく使うもの順に並べる
.values
データフレームの要素をnumpyのndarrayの形式で返す。
.dtypes
DataFrameのcolumnsごとのdtypeをまとめたSeriesを返す
.loc
ラベルによる選択のための純粋なラベル位置ベースのインデクサー(直訳)
.iloc
位置による選択のための純粋な整数位置ベースの索引付け(直訳)
.ndim
アレイの次元数(軸の本数)を返す。
.shape
データフレームの行列数を表すタプルを返す。(何行何列か)
.size
データフレームの要素数を返す。(行数*列数)
.T
行列を入れ替える。(転置行列の取得)
.at
ラベルベース高速スカラーアクセサー
.axes
行方向と列方向のラベル情報をまとめたリストを返す。
.blocks
内部属性、as_blocks()と同義
.empty
中身が完全に空の時、Trueを返す。軸の長さが0であることを意味する。
.ftype
このオブジェクトのftypes (疎/密とdtypeの表示)をSeriesの形で返す。(疎密はどういう意味か??)
.iat
高速な整数位置スカラーアクセサー
.ix
主にラベル位置ベースのインデクサーで、整数位置のフォールバックをもつ。(直訳)
最近これをJyputer notebook上で使うと、非推奨のwarningが出る。
.style
DataFrameのスタイル付きHTML表現を構築するためのメソッドを含むStylerオブジェクトを返す(直訳)
メソッド
以下、現在作成中