これは何度も自分でググっているので、自分用のメモです。
メモ
DataFrame のデータの変更
dtype 変更
まとめて変更したいとき。
df = df.astype({'a': 'float32', 'c': 'int8'})
ひとつだけ変更したいとき
df = df.aaaa.astype('int32')
NaN (Not a Number)
### NaNの数を数える
NaN (not a number)を確認できる。
df.info()
df.isnull().sum()
NaNを削除する
ある項目(列)の値がNaNであるを削除する. dropnaを使います。
df.dronna(subset= [])
削除
drop を使います。
行番号を指定して削除
下記を参考にしました。
ファイル入出力
CSVファイルを読む
普通はread_csv だけで仕事をしていますが、ときに、データを読んで後でラベルを振りたいときもあります。
CSVファイルから読む。行の名前を自分でつけるとき。1行目を無視して、そのあとつける。
df = pd.read_csv('input.csv', skiprows=1, white...)
df.columns = ['time', 'data1', 'data2']
CSVファイルに保存
CSVファイルに保存するにはto_csvを使う。オプションで引数でindex(行の名前)、header(列の名前)の有無を指定する。個人的には、いつもindex=Falseにしています。
df.to_csv('out.csv', header=True, index=False)
まとめ
これまでのメモ
備考
pandas 関係でいつも何度も調べなおしていることがあり、思い出したらここに追加していこう。(2020/08/08)
- 削除、ファイルの入出力を追加(2021/01/24)
- 行番号を指定して削除、のリンクを追加(2021/05/23)