13

More than 5 years have passed since last update.

ASCII, S-JIS, UTF-8

文字コード

19

Posted at 2018-02-12

ASCII

半角英数を1Byte(8bit)で表現
- 実際は、7bitしか利用していない
代表的なコード

文字	コード(16進数)	備考
LF	0A	Unix系の改行
CR	0D	windowsの改行(CRLF)
SP	20	空白
0	30
\|5C	文字化けの原因
a	61
DEL	7F	ASCII最大コード

S-JIS

ASCIIを拡張している
- 半角英数のみを見るとASCIIと同じ文字コードとなる
半角カナは1Byte
- ASCIIと被らないように8bit目を利用している
漢字は2Byte
- 1Byte目は、ASCIIと半角カナと被らないコードを利用
- 2Byte目は、ASCIIと半角カナと被ることもある
  - この仕様が、文字化けの原因となる。
文字化け
- /がエスケープ文字の意味を持つ言語で、2Byte目が/の漢字を利用した場合、/が消えてしまう。
  - 例：「申」「十」「表」

UTF-8

ASCIIを拡張している
- 半角英数のみを見るとASCIIと同じ文字コードとなる
S-JISの文字化け対策
- 漢字の2Byte目が、ASCIIと半角カナと被らないコードを利用しているため、/による文字化けはおこらない

13

Register as a new user and use Qiita more conveniently

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

13