$ wc -l ok.csv
13773
のok.csvを
$ uniq ok.csv > ok_uniq.csv
$ wc -l ok_uniq.csv
13562
$ uniq -d ok.csv > ok_repeated.csv
$ wc -l ok_repeated.csv
197
13773 - 13562 = 211
211 - 197 = 14
14行はどこへ行った?
結論から言うとダブりが3行あると1行はどちらにも入らずに消えているみたいですね。
3行ダブりが14回ほど3行ダブりが12回、4行ダブりが1回あったみたいです。
2行ダブりはuniq.csv, repeated.csvのどちらにも1行入るように振り分けられ、
3行ダブりはどちらにも1行入って、どちらにも入らずに1行が消えていく。
4行ダブりでも、1行がどちらにも入らずに消えているようで、1行がuniqとして、2行が2行がどちらにも入らずに消えて、1行がuniq.csvへ入り、1行がrepeat.csvへ入ります。