1. はじめに
文字コードであるshift-jisやutf-8はよく触れる機会がありますが、内容を理解していなかったため、記事としてまとめます。
2. 文字コードとは
文字コードは、コンピュータで文字や記号をバイナリ形式で表現するための規則です。文字コードは、それぞれの文字や記号に一意な数値を割り当て、これをコンピュータが理解できる形式に変換します。以下では具体例を挙げます。
2.1 UTF-8とは
UTF-8は、Unicode文字をエンコードするための一つの手法です。Unicodeは、異なる言語で使用される文字を一貫して扱うためのコードセットです。
UTF-8は世界的に広く使われています。。多くのソフトウェア開発プロジェクトでも利用されています。
2.2 JISとは
JIS(ジス)は、JIS(日本工業規格)が定めた情報交換用の文字コードのことです。また、下記のような文字の種類もJISのなかに含まれます。
・ASCIIコード
・ひらがな
・漢字
・カタカナ
なお、JISは電子メールを日本語で送受信する際の標準規格となっています。また、インターネット上においても標準的な文字コードです。
2.3 shift-jisとは
Shift_JIS(シフトジス)は、SJISとも呼ばれているMicrosoft社が開発した文字コードです。世界的標準であるASCIIコードの文字に、日本語を追加した文字コードになります。
日本語を扱う文字コードとしてMS-DOSやWindows、MacやUNIXなど幅広く利用されています。また、Shift_JISは、JIS規格によって定められたJISコードの改良版です。
おわりに
文字コードについて理解を深めていただけたら幸いです。