2つのTBLの差分を比較して相違点を洗い出す。
a1 = pd.read_csv("test.csv")
a2 = pd.read_csv("test2.csv")
a_merge = pd.merge(a1,a2,how="outer",on="カラム1",indicator=True)
a_merge["_merge"].values_counts()
肝はindicatorを使うこと。_mergeカラムができること。
indicatorはどれぐらい紐づいているかを判別するオプションみたいですね。
2つをマージして、_mergeをみると
both , left_only,right_onlyの表示が出てくる。
これにより、左にしかないもの右にしかないものを見ることが可能になる。
最終的に、以下を実行すれば違うところが目に見えてわかるので便利かもしれない。。。
a_merge[a_merge["_merge"] == "left_only"]
a_merge[a_merge["_merge"] == "right_only"]