Posted at

令和の「令」の字がUNICODEに2つ収録されている件

UNICODEは複雑怪奇です。

新元号「令和」の「令」の字が U+4EE4 と U+F9A8 に収録されています。

なんでですかーーーー?


予想

「令」の字は活字と手書きで字体が異なることで有名です。

手書きだと下の部分を「マ」みたいに書くと思います。

令.png

この手書きバージョンを後から収録したのかなと。

しかし、それは 異体字セレクタ の方で解決しています。

じゃあ U+F9A8 は何なんだ?


答え

U+F900 から U+FA0B までは韓国語の都合で収録されたものです。

元々、中国での漢字は字と読みが1対1で対応しているものです。

日本で音読みが2種類以上あるのは、漢字が入ってきたときの聞き取りに揺れがあって、様々な音読みが当てられてしまったからです。

一方、韓国では、基本的には字と読みが1対1なんですが、字によっては複数の読みがある場合があります。

で、韓国国内ではそれらに別の文字コードを割り当てたいという要望があるみたいです。

ただ、今の韓国語は漢字をほぼ使わずハングル(日本語で言うところのひらがなに相当するもの)だけにしているので、別にどうでもいいという立場だったものの、ユニコードコンソーシアムが忖度(?)して収録しちゃったみたいです。

日本語を扱うシステムで、この地雷を踏んでしまうことはほとんど無さそうです。

同様の地雷は268文字あって、金・女・裸・溺など、ポピュラーな漢字が含まれているので、いままで問題なければ、これからも問題ないかなという印象です。


まとめ

多様な文化を積極的に受け入れて平和な世界にしていきましょう!


参考文献

CJK互換漢字 - Wikipedia

u4ee4(令) - グリフウィキ