UNICODEは複雑怪奇です。
新元号「令和」の「令」の字が U+4EE4 と U+F9A8 に収録されています。
なんでですかーーーー?
#予想
「令」の字は活字と手書きで字体が異なることで有名です。
手書きだと下の部分を「マ」みたいに書くと思います。
この手書きバージョンを後から収録したのかなと。
しかし、それは 異体字セレクタ の方で解決しています。
じゃあ U+F9A8 は何なんだ?
#答え
U+F900 から U+FA0B までは韓国語の都合で収録されたものです。
元々、中国での漢字は字と読みが1対1で対応しているものです。
日本で音読みが2種類以上あるのは、漢字が入ってきたときの聞き取りに揺れがあって、様々な音読みが当てられてしまったからです。
一方、韓国では、基本的には字と読みが1対1なんですが、字によっては複数の読みがある場合があります。
で、韓国国内ではそれらに別の文字コードを割り当てたいという要望があるみたいです。
ただ、今の韓国語は漢字をほぼ使わずハングル(日本語で言うところのひらがなに相当するもの)だけにしているので、別にどうでもいいという立場だったものの、ユニコードコンソーシアムが忖度(?)して収録しちゃったみたいです。
日本語を扱うシステムで、この地雷を踏んでしまうことはほとんど無さそうです。
同様の地雷は268文字あって、金・女・裸・溺など、ポピュラーな漢字が含まれているので、いままで問題なければ、これからも問題ないかなという印象です。
#まとめ
多様な文化を積極的に受け入れて平和な世界にしていきましょう!