概要
- Finderの並び順のルールがきになったので少し試してみた
- これといった情報は見つからず仕舞い
- こちらはただ一旦集めた情報をまとめてみたという記事です
実証
- 「み」「錦」「凸」の並び順を考える
- 英語環境・日本語環境で並び順が異なる結果となる
- それぞれの文字コードは以下の通り
- 英語環境下だと以下の並び
-
UTF-8
での比較?
-
- 日本語環境下だと以下の並び
-
Shift-JIS
での比較?
-
- 同じことをPythonで試してみた結果
names = ["凸", "み", "錦"]
names_sorted_by_utf8 = sorted(names, key=lambda name: name)
names_sorted_by_sjis = sorted(names, key=lambda name: name.encode('shift_jis'))
print(f'utf8: {names_sorted_by_utf8}')
print(f'sjis: {names_sorted_by_sjis}')
utf8: ['み', '凸', '錦']
sjis: ['み', '錦', '凸']
その他考慮が必要そうなこと
-
jaconv
- ひらがな・カタカナの変換が一旦必要
-
natsort 7.1.1
- 自然順ソートも考慮が必要
- Python 3.x - Python3 ファイルを順番通りに読み込みたい|teratail
- 真偽不明