import pandas as pd
import numpy as np
csvファイルを読み込む
df=pd.read_csv('〜〜〜.csv',header=None,names=('name', 'id'))
names=〜〜でカラム名を指定。
header=Noneで一行目をheaderと認識しないようにしている。
データの一部を置換する
df=df.replace('A B', 'エー ビー')
df=df.replace('B A', 'ビー エー')
dfの一つのカラムの中のテキストを分割して新たに2つのカラムにする
df2 = pd.concat([df, df['name'].str.split(' ', expand=True)], axis=1).drop('name', axis=1)
dfの複数の列を取り出す
df=df.loc[:,["列名","列名","列名"]]
dfどうしを縦に結合する
df3=pd.concat([df1, df2])
重複した行を削除する
df=df[~df.duplicated()]
条件を満たす行を取り出す
df[df["列名"]=="~~"]
dataframeをリストにする
df_list=df.values.tolist()
列のリストをarrayにする
df_list=np.array(df['列名'])