More than 5 years have passed since last update.

データフレームの扱い方

Last updated at 2020-04-28Posted at 2020-04-28

import pandas as pd
import numpy as np

df=pd.read_csv('〜〜〜.csv',header=None,names=('name', 'id'))

names=〜〜でカラム名を指定。
header=Noneで一行目をheaderと認識しないようにしている。

df=df.replace('A B', 'エー ビー')
df=df.replace('B A', 'ビー エー')

df2 = pd.concat([df, df['name'].str.split(' ', expand=True)], axis=1).drop('name', axis=1)

df=df.loc[:,["列名","列名","列名"]]

df3=pd.concat([df1, df2])

df=df[~df.duplicated()]

df[df["列名"]=="~~"]

df_list=df.values.tolist()

df_list=np.array(df['列名'])

データフレーム の扱い方