この記事はスクレイピングしてきたデータ型がいろいろ変だったりしたときに行った処理の備忘録です。
データの型を確認する
df['column名'].dtype #DataFrame
np.dtype() #numpy配列
データ型の変更
df['column名'].astype(int) #intに変換
df['column名'].dtype(float) #floatに変換
df['column名'].dtype(str) #文字列に変換
欠損値の確認
df.isnull()
欠損値を削除する
df.dropna()
pandasの行削除
df.drop(行数)
pandasに列追加
df['新しい列の名前']=[a,b,c,d,...]