注意
本記事は2019年10月15日におけるKaggle Notebook上で実験したものです。
2021年4月7日におけるKaggle Notebookでは下記の現象は起きなかったため、バージョンが上がり改善されたと思われます。
pd.concat()の引数sortのデフォルトがFalseになっているようです。
何があったの
pd.concat()にて縦方向の結合を行ったら、列の順番が勝手に変わる事象に出くわしたため、
その解決法を書きます。
問題
タイタニックデータをインポートして
import pandas as pd
train = pd.read_csv('../input/titanic/train.csv')
test = pd.read_csv('../input/titanic/test.csv')
trainとtestを見てみると
列がアルファベット順に入れ替わります。
解決法
sort=Falseを追記してあげれば解決します。
train_test_concat = pd.concat([train,test],axis=0,sort=False)
warningを見れば一発ですが、
下記のコードのようにwarningを無視していると意外とはまるため、
一応記事にまとめました。
import warnings
warnings.simplefilter('ignore')


