LoginSignup
7
5

More than 5 years have passed since last update.

令和の「令」の字がUNICODEに2つ収録されている件

Posted at

UNICODEは複雑怪奇です。

新元号「令和」の「令」の字が U+4EE4 と U+F9A8 に収録されています。

なんでですかーーーー?

予想

「令」の字は活字と手書きで字体が異なることで有名です。

手書きだと下の部分を「マ」みたいに書くと思います。

令.png

この手書きバージョンを後から収録したのかなと。

しかし、それは 異体字セレクタ の方で解決しています。

じゃあ U+F9A8 は何なんだ?

答え

U+F900 から U+FA0B までは韓国語の都合で収録されたものです。

元々、中国での漢字は字と読みが1対1で対応しているものです。

日本で音読みが2種類以上あるのは、漢字が入ってきたときの聞き取りに揺れがあって、様々な音読みが当てられてしまったからです。

一方、韓国では、基本的には字と読みが1対1なんですが、字によっては複数の読みがある場合があります。
で、韓国国内ではそれらに別の文字コードを割り当てたいという要望があるみたいです。
ただ、今の韓国語は漢字をほぼ使わずハングル(日本語で言うところのひらがなに相当するもの)だけにしているので、別にどうでもいいという立場だったものの、ユニコードコンソーシアムが忖度(?)して収録しちゃったみたいです。

日本語を扱うシステムで、この地雷を踏んでしまうことはほとんど無さそうです。
同様の地雷は268文字あって、金・女・裸・溺など、ポピュラーな漢字が含まれているので、いままで問題なければ、これからも問題ないかなという印象です。

まとめ

多様な文化を積極的に受け入れて平和な世界にしていきましょう!

参考文献

CJK互換漢字 - Wikipedia
u4ee4(令) - グリフウィキ

7
5
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
7
5