Unicodeとは
Unicodeとは文字集合。世界中で使われている文字を集めたもの。
UTF8とUTF-16とは
UTF8とUTF-16はUnicodeで定義されている文字を符号化(エンコーディング)するもの。
| Unicode | UTF-8 | UTF-16 |
| ---- | ---- |
| あ | E3 81 82 | 42 30 |
ユニコードエスケープ形式とは
使用する文字コードが不明な状態を表現するために利用されるのがユニコードスケープ形式。
ユニコードエスケープ形式では「\u」に、文字の符号位置を表す16進数の値を付加します。たとえば「あ」という文字であれば「\u3042」。