表の意味
この記事に掲載している表は、マルチバイト文字(文字により使用するバイト数が可変である文字)のバイト数を判定するための基礎となる表です。
文字コード表の中で割り当てられているエリアを見ることにより、その文字が何バイトの文字であるかを判定することができます。
(自分のHPにも簡易なものを掲載していますが、そちらはいずれ書き直す予定です。)
文字コードごとの割当てエリア
以下、日本語で使用する主な文字コードのうちUTF-8、SHIFT_JIS、EUC-JPの3つについて、簡単にまとめておきます。
なお、UTF-16、UTF-32等の固定長の文字については、本記事の対象外です(UTF-16及びUTF-32は完全な固定長ではなく、サロゲートペアなどもあるので注意が必要ですが)。
UTF-8の割当てエリア
UTF-8は、文字により1バイトから6バイトまでと、その使用領域が異なります。
ただし、現在のUTF-8には5バイト文字、6バイト文字が存在しないため、実際は4バイト文字までの判定をすれば事足りると思います。
UTF-8は、次の表のように最初の1バイト目がどのエリアにあるかを確認するだけで、その文字が何バイト文字かを判定することができます。
項番 | 区分 | 数値のエリア(2進数、16進数) | ビット演算による算出式 |
---|---|---|---|
1 | 1byte文字 | 00000000(0x00) ~ 01111111(0x7F) | (*str & 0x80) == 0x00 |
2 | 2byte文字の開始バイト | 11000000(0xC0) ~ 11011111(0xDF) | (*str & 0xE0) == 0xC0 |
3 | 3byte文字の開始バイト | 11100000(0xE0) ~ 11101111(0xEF) | (*str & 0xF0) == 0xE0 |
4 | 4byte文字の開始バイト | 11110000(0xF0) ~ 11110111(0xF7) | (*str & 0xF8) == 0xF0 |
5 | 5byte文字の開始バイト | 11111000(0xF8) ~ 11111011(0xFB) | (*str & 0xFC) == 0xF8 |
6 | 6byte文字の開始バイト | 11111100(0xFC) ~ 11111101(0xFD) | (*str & 0xFE) == 0xFC |
7 | マルチバイト文字の2バイト目以降 | 10000000(0x80) ~ 10111111(0xBF) | (*str & 0xC0) == 0x80 |
*str
には、判定したい文字コードの数値が入ります。
文字数をカウントする場合は、1バイトずつループさせて「項番7のマルチバイト文字の2バイト目以降
の部分をカウントしない(それ以外は全てカウントする)」というやり方が簡単です。
具体的なコードの記述例は、こちらを参照してください。
SHIFT-JISの割当てエリア
SHIFT_JISには、1バイト文字と2バイト文字の2種類があります。
2バイト文字の第2バイト(下位バイト)のエリアが広く、1バイト文字と同じエリアを使用している部分があるため、バイト数の判定などに少々工夫が必要となります。
項番 | 区分 | 数値のエリア(2進数、16進数) | ビット演算による算出式 |
---|---|---|---|
1 | 1byte文字 | 00000000(0x00) ~ 01111111(0x7F) | (*str & 0x80) == 0x00 |
2 | 2byte文字の第1バイト | 10000001(0x81) ~ 10011111(0x9F) | (*str & 0xE0) == 0x80 |
3 | 2byte文字の第1バイト | 11100000(0xE0) ~ 11111100(0xEC) | (*str & 0xE0) == 0xE0 |
4 | 2byte文字の第2バイト | 01000000(0x40) ~ 01111110(0x7E) | (*str & 0xC0) == 0x40 |
5 | 2byte文字の第2バイト | 11100000(0xE0) ~ 11111100(0xEC) | (*str & 0xE0) == 0xE0 |
*str
には、判定したい文字コードの数値が入ります。
ビット演算による算出式
では、実際よりも広めのエリアを拾っています。
具体的なコードの記述例は、こちらを参照してください。
EUC-JPの割当てエリア
EUC-JPにも、1バイト文字と2バイト文字の2種類があります。
1バイト文字と2バイト文字の使用エリアが重なっていないため、SHIFT_JISよりは扱いやすいと思います。
項番 | 区分 | 数値のエリア(2進数、16進数) | ビット演算による算出式 |
---|---|---|---|
1 | 1byte文字 | 00000000(0x00) ~ 01111111(0x7F) | (*str & 0x80) == 0x00 |
2 | 2byte文字の第1バイト | 10001110(0x8E) | (*str & 0x80) == 0x80 |
3 | 2byte文字の第1バイト | 10100001(0xA1) ~ 11111110(0xFE) | (*str & 0x80) == 0x80 |
4 | 2byte文字の第2バイト | 10100001(0xA1) ~ 11111110(0xFE) | (*str & 0x80) == 0x80 |
*str
には、判定したい文字コードの数値が入ります。
ビット演算による算出式
では、実際よりも広めのエリアを拾っています。
具体的なコードの記述例は、こちらを参照してください。
マルチバイト文字の割り当てエリア一覧
この辺になると、更に需要がないと思いますが、詳細に区分したエリア一覧表を以下に掲載しておきます。
16進 | 2進 | ASCII | UTF-8 | S-JIS(上位) | S-JIS(下位) | EUC-JP(上位) | EUC-JP(下位) |
---|---|---|---|---|---|---|---|
00 | 00000000 | NUL | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
01 | 00000001 | SOH | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
02 | 00000010 | STX | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
03 | 00000011 | ETX | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
04 | 00000100 | EOT | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
05 | 00000101 | ENQ | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
06 | 00000110 | ACK | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
07 | 00000111 | BEL | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
08 | 00001000 | BS | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
09 | 00001001 | HT | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
0A | 00001010 | LF | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
0B | 00001011 | VT | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
0C | 00001100 | FF | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
0D | 00001101 | CR | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
0E | 00001110 | SO | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
0F | 00001111 | SI | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
10 | 00010000 | DLE | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
11 | 00010001 | DC1 | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
12 | 00010010 | DC2 | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
13 | 00010011 | DC3 | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
14 | 00010100 | DC4 | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
15 | 00010101 | NAK | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
16 | 00010110 | SYN | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
17 | 00010111 | ETB | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
18 | 00011000 | CAN | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
19 | 00011001 | EM | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
1A | 00011010 | SUB | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
1B | 00011011 | ESC | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
1C | 00011100 | FS | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
1D | 00011101 | GS | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
1E | 00011110 | RS | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
1F | 00011111 | US | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
20 | 00100000 | SPC | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
21 | 00100001 | ! | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
22 | 00100010 | " | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
23 | 00100011 | # | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
24 | 00100100 | $ | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
25 | 00100101 | % | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
26 | 00100110 | & | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
27 | 00100111 | ' | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
28 | 00101000 | ( | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
29 | 00101001 | ) | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
2A | 00101010 | * | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
2B | 00101011 | + | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
2C | 00101100 | , | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
2D | 00101101 | - | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
2E | 00101110 | . | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
2F | 00101111 | / | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
30 | 00110000 | 0 | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
31 | 00110001 | 1 | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
32 | 00110010 | 2 | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
33 | 00110011 | 3 | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
34 | 00110100 | 4 | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
35 | 00110101 | 5 | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
36 | 00110110 | 6 | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
37 | 00110111 | 7 | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
38 | 00111000 | 8 | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
39 | 00111001 | 9 | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
3A | 00111010 | : | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
3B | 00111011 | ; | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
3C | 00111100 | < | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
3D | 00111101 | = | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
3E | 00111110 | > | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
3F | 00111111 | ? | 1byte(ASCII) | 1byte(ASCII) | 1byte(ASCII) | ||
40 | 01000000 | @ | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
41 | 01000001 | A | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
42 | 01000010 | B | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
43 | 01000011 | C | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
44 | 01000100 | D | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
45 | 01000101 | E | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
46 | 01000110 | F | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
47 | 01000111 | G | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
48 | 01001000 | H | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
49 | 01001001 | I | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
4A | 01001010 | J | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
4B | 01001011 | K | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
4C | 01001100 | L | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
4D | 01001101 | M | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
4E | 01001110 | N | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
4F | 01001111 | O | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
50 | 01010000 | P | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
51 | 01010001 | Q | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
52 | 01010010 | R | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
53 | 01010011 | S | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
54 | 01010100 | T | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
55 | 01010101 | U | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
56 | 01010110 | V | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
57 | 01010111 | W | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
58 | 01011000 | X | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
59 | 01011001 | Y | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
5A | 01011010 | Z | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
5B | 01011011 | [ | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
5C | 01011100 | |1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | ||
5D | 01011101 | ] | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
5E | 01011110 | ^ | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
5F | 01011111 | _ | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
60 | 01100000 | ` | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
61 | 01100001 | a | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
62 | 01100010 | b | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
63 | 01100011 | c | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
64 | 01100100 | d | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
65 | 01100101 | e | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
66 | 01100110 | f | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
67 | 01100111 | g | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
68 | 01101000 | h | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
69 | 01101001 | i | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
6A | 01101010 | j | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
6B | 01101011 | k | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
6C | 01101100 | l | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
6D | 01101101 | m | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
6E | 01101110 | n | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
6F | 01101111 | o | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
70 | 01110000 | p | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
71 | 01110001 | q | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
72 | 01110010 | r | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
73 | 01110011 | s | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
74 | 01110100 | t | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
75 | 01110101 | u | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
76 | 01110110 | v | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
77 | 01110111 | w | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
78 | 01111000 | x | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
79 | 01111001 | y | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
7A | 01111010 | z | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
7B | 01111011 | { | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
7C | 01111100 | | | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
7D | 01111101 | } | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
7E | 01111110 | ~ | 1byte(ASCII) | 1byte(ASCII) | 2byte(下位) | 1byte(ASCII) | |
7F | 01111111 | DEL | 1byte(制御) | 1byte(制御) | 1byte(制御) | ||
80 | 10000000 | (※2byte目以降) | 2byte(下位) | ||||
81 | 10000001 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
82 | 10000010 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
83 | 10000011 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
84 | 10000100 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
85 | 10000101 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
86 | 10000110 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
87 | 10000111 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
88 | 10001000 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
89 | 10001001 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
8A | 10001010 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
8B | 10001011 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
8C | 10001100 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
8D | 10001101 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
8E | 10001110 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | 2byte(半角カナ) | ||
8F | 10001111 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
90 | 10010000 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
91 | 10010001 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
92 | 10010010 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
93 | 10010011 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
94 | 10010100 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
95 | 10010101 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
96 | 10010110 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
97 | 10010111 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
98 | 10011000 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
99 | 10011001 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
9A | 10011010 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
9B | 10011011 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
9C | 10011100 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
9D | 10011101 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
9E | 10011110 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
9F | 10011111 | (※2byte目以降) | 2byte(全角) | 2byte(下位) | |||
A0 | 10100000 | (※2byte目以降) | 2byte(下位) | ||||
A1 | 10100001 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
A2 | 10100010 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
A3 | 10100011 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
A4 | 10100100 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
A5 | 10100101 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
A6 | 10100110 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
A7 | 10100111 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
A8 | 10101000 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
A9 | 10101001 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
AA | 10101010 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
AB | 10101011 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
AC | 10101100 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
AD | 10101101 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
AE | 10101110 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
AF | 10101111 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
B0 | 10110000 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
B1 | 10110001 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
B2 | 10110010 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
B3 | 10110011 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
B4 | 10110100 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
B5 | 10110101 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
B6 | 10110110 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
B7 | 10110111 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
B8 | 10111000 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
B9 | 10111001 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
BA | 10111010 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
BB | 10111011 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
BC | 10111100 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
BD | 10111101 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
BE | 10111110 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
BF | 10111111 | (※2byte目以降) | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
C0 | 11000000 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
C1 | 11000001 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
C2 | 11000010 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
C3 | 11000011 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
C4 | 11000100 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
C5 | 11000101 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
C6 | 11000110 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
C7 | 11000111 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
C8 | 11001000 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
C9 | 11001001 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
CA | 11001010 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
CB | 11001011 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
CC | 11001100 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
CD | 11001101 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
CE | 11001110 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
CF | 11001111 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
D0 | 11010000 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
D1 | 11010001 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
D2 | 11010010 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
D3 | 11010011 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
D4 | 11010100 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
D5 | 11010101 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
D6 | 11010110 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
D7 | 11010111 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
D8 | 11011000 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
D9 | 11011001 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
DA | 11011010 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
DB | 11011011 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
DC | 11011100 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
DD | 11011101 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
DE | 11011110 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
DF | 11011111 | 2byte文字の開始 | 1byte(半角カナ) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
E0 | 11100000 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
E1 | 11100001 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
E2 | 11100010 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
E3 | 11100011 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
E4 | 11100100 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
E5 | 11100101 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
E6 | 11100110 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
E7 | 11100111 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
E8 | 11101000 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
E9 | 11101001 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
EA | 11101010 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
EB | 11101011 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
EC | 11101100 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
ED | 11101101 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
EE | 11101110 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
EF | 11101111 | 3byte文字の開始 | 2byte(全角) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
F0 | 11110000 | 4byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
F1 | 11110001 | 4byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
F2 | 11110010 | 4byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
F3 | 11110011 | 4byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
F4 | 11110100 | 4byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
F5 | 11110101 | 4byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
F6 | 11110110 | 4byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
F7 | 11110111 | 4byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
F8 | 11111000 | 5byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
F9 | 11111001 | 5byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
FA | 11111010 | 5byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
FB | 11111011 | 5byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
FC | 11111100 | 6byte文字の開始 | 2byte(拡張) | 2byte(下位) | 2byte(全角) | 2byte(下位) | |
FD | 11111101 | 6byte文字の開始 | 2byte(全角) | 2byte(下位) | |||
FE | 11111110 | 2byte(全角) | 2byte(下位) | ||||
FF | 11111111 |
(制御)
は制御コード、(ASCII)
はアスキー文字が割り当てられているエリアです。
(拡張)
は、各ベンダーが固有に実装しているエリアです。