LoginSignup
18
13

More than 5 years have passed since last update.

ASCII, S-JIS, UTF-8

Posted at

ASCII

  • 半角英数を1Byte(8bit)で表現
    • 実際は、7bitしか利用していない
  • 代表的なコード
文字 コード(16進数) 備考
LF 0A Unix系の改行
CR 0D windowsの改行(CRLF)
SP 20 空白
0 30
\ 5C 文字化けの原因
a 61
DEL 7F ASCII最大コード

S-JIS

  • ASCIIを拡張している
    • 半角英数のみを見るとASCIIと同じ文字コードとなる
  • 半角カナは1Byte
    • ASCIIと被らないように8bit目を利用している
  • 漢字は2Byte
    • 1Byte目は、ASCIIと半角カナと被らないコードを利用
    • 2Byte目は、ASCIIと半角カナと被ることもある
      • この仕様が、文字化けの原因となる。
  • 文字化け
    • /がエスケープ文字の意味を持つ言語で、2Byte目が/の漢字を利用した場合、/が消えてしまう。
      • 例:「申」「十」「表」

UTF-8

  • ASCIIを拡張している
    • 半角英数のみを見るとASCIIと同じ文字コードとなる
  • S-JISの文字化け対策
    • 漢字の2Byte目が、ASCIIと半角カナと被らないコードを利用しているため、/による文字化けはおこらない
18
13
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
18
13