応用情報技術者平成29年秋期 午前4
UTF-8の説明に関する記述として,適切なものはどれか。
1、UTF-8は、
ASCIIと同じ文字は1バイト、その他の文字については2~6バイトを用いて世界中の文字を表現する文字符号化形式です。ASCIIの上位互換であるため、従来のシステムとの親和性が高く、またASCII主体のテキストであればデータ量をそれほど増加させずに多言語対応の恩恵を受けられる利点があります。UTF-8は世界中で使用されていますが、特にWebページを記述する際の文字コードとしてはスタンダードと呼ばれるほど普及しています。
UTF-8は可変長なので先頭のビット"1"が連続する個数で、その文字のバイト数がわかるようになっています。なお漢字を含む日本語の文字は3バイトで表現されます。
2、UTF-7の説明
ASCII文字だけを使用することが前提の電子メールで利用するために,7ビットで表現する。
3、1文字を2バイトで符号化する UTF-16(UCS-2)
2バイトで表現する領域に収まらない文字は,上位サロゲートと下位サロゲートを組み合わせて4バイトで表現する。
4、1文字を4バイトで符号化する UTF-32(UCS-4)の説明
各符号位置が4バイトの固定長で表現される符号化形式である。