文字コードについてメモ。
ASCIIコード
英数字と記号を0-255の範囲で表す。1バイトで表現される。
日本語の文字コード
JISコード
日本規格協会(JIS)が定めたコード。
シフトJISコード
JISコードを計算し、ASCIIコードで未使用になっている番号に割り当てられるようにに変換したもの。
MicroSoft社が考案し、Windows、Macで使われている。
EUC-JP
シフトJIS同様だが、ASCIIコードで未使用になっている番号に押割り当てられるようにに変換したもの。(シフトJISとは違う計算方法)
LinuxなどのOSで使われている。
UTF-8
最近はUTF-8が使われるようになった。
UTF-8は世界共通の文字コードであるUnicodeをプログラムで扱いやすいように変換したもの。
Unicodeは2バイト固定だが、UTF-8は英数字はASCIIコード同様1バイト、それ以外の文字は2-4バイトの範囲で可変に表現。
文字の形と文字コードの統一がされているので、多言語に対応可能。
多言語の混在もできるし、世界共通なので欧米圏のソフトをそのまま使用できる。