コンピュータは文字に数値を割り当てることで、文字データを表現します。
文字コードは各文字に割り当てられる数値のこと。
しかし
数値の当て方にはそれぞれ方言があり、ひらがなカタカナ漢字を使う日本みたいな多くの種類の文字を使う国もある。
それぞれを256通りで表現できないために文字コードにはいろいろな種類がある。
気づき
方言とは?
どんな種類だろうか?
文字コード表を見てみよう。
最もポピュラーなASCIIのコード表を見てみる。
縦横を使い1と0で表現されている。
例えばAを表示するときは
01000001で表す。
後ろから
0001は行の数値
100は列の数値
最初の0はデータの誤りを検査するのに使う。
文字コードの種類とその特徴
ASCII(アスキー)
かなり基本的な文字コード。
含まれている文字はアルファベット、数字、いくつかの記号のみ。
文字を1文字7ビットで表す。
EBCDIC(エビシディック)
一文字を8ビットを使って表現。
大型汎用コンピュータなどで使われている。
疑問 大型の汎用コンピュータとは?
-
メインフレームとは、大企業や官公庁などの基幹情報システムなどに用いられる大型のコンピュータ製品。最も古くから普及している製品カテゴリーで、多数の利用者や業務で共有し、大量の重要なデータや処理を扱うため、極めて高い性能や信頼性を実現している。
出典 https://e-words.jp/w/%E3%83%A1%E3%82%A4%E3%83%B3%E3%83%95%E3%83%AC%E3%83%BC%E3%83%A0.html -
汎用コンピュータとは、パソコンなど、科学技術計算、事務処理、制御用など、ソフトウェア次第で様々な用途に利用することができる大型のコンピュータのことである。基幹業務処理において利用されることが多い。メインフレームとも呼ばれる。
出典 https://www.weblio.jp/content/%E5%A4%A7%E5%9E%8B%E6%B1%8E%E7%94%A8%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF
大きい且つ重大なコンピュータなのか。
シフトJISコード(S-JIS)(シフトジスコード/エス-ジス)
ASCIIのコード体系の文字と混在させて使えるようになっている日本語文字コードです。
ひらがな、カタカナ、漢字などを扱える。
1文字を2バイトで表す。
ECU
拡張UNIXコードとも呼ばれる。
UNIXというOSでよく使われる日本語コード。
基本的には1文字2バイト。補助漢字などは3バイト使う。
疑問 補助漢字とは?
-
JIS X 0208で利用できない文字を集めた文字セットのこと。
漢字5,801文字のほか、非漢字266文字を含みます。文字セットとしては、一般的に「JIS X 0212-1990」と呼ばれます。
出典 https://www.morisawa.co.jp/culture/dictionary/1940#:~:text=JIS%20X%200208%E3%81%A7%E5%88%A9%E7%94%A8,1990%E3%80%8D%E3%81%A8%E5%91%BC%E3%81%B0%E3%82%8C%E3%81%BE%E3%81%99%E3%80%82 -
JIS第一水準、第二水準では絶対的な漢字の量が不足しているため、1990年に「情報交換用漢字符号-補助漢字(JIS X 0212)」として5801文字が規定されたもの。
出典 https://kotobank.jp/word/%E8%A3%9C%E5%8A%A9%E6%BC%A2%E5%AD%97-11854
利用できない文字を集めた文字セット
気づき
補助漢字を3バイトで表すのか。
Unicode(ユニコード)
全世界の文字コードを一つに統一したもの。
各国のあらゆる文字を一つのコード体系で表そうとした文字コード。
最初は2バイトだったが今は4バイトまで拡張している。
疑問 コード体系
-
コード体系
ID とコードは、Oracle にすれば無関心?なのであるが、人間には、そのデータの位置付けは大きく異なる。
コード
ある文字列や数字列において、1 つ、または、複数のパートによって意味づけされた文字・数字の集合。
識別子(ID)
コードのような体系の無い(一意に識別するための)番号もしくは文字列をあらわす
文字列と文章の違いを考えればわかりやすい。
出典 https://www.shift-the-oracle.com/words/code-structure.html#:~:text=%E3%81%82%E3%82%8B%E6%96%87%E5%AD%97%E5%88%97%E3%82%84%E6%95%B0%E5%AD%97,%E3%81%9F%E6%96%87%E5%AD%97%E3%83%BB%E6%95%B0%E5%AD%97%E3%81%AE%E9%9B%86%E5%90%88%E3%80%82&text=%E6%97%A5%E6%9C%AC%E3%81%A7%E3%81%AF%20%E8%B2%A1%E5%9B%A3%E6%B3%95%E4%BA%BA%20%E6%B5%81%E9%80%9A,%E4%B8%80%E5%85%83%E7%AE%A1%E7%90%86%E3%81%95%E3%82%8C%E3%81%A6%E3%81%84%E3%82%8B%E3%80%82 -
例えば型番(品番)が「TXD11-100×60-R」で、「TXD11」は製品のシリーズを表し「100×60」はサイズを表し「R」は色を表すというようなコード体系があります。
出典 https://www.synapse-i.jp/public-relations/201708056745#:~:text=%E3%81%8C%E3%81%82%E3%82%8A%E3%81%BE%E3%81%99%E3%80%82-,%E4%BE%8B%E3%81%88%E3%81%B0,-%E5%9E%8B%E7%95%AA%EF%BC%88%E5%93%81%E7%95%AA%EF%BC%89%E3%81%8C
英数字の文字列の構造のことをコード体系というのかな。(?)
そうしておこう。
コンピュータで使われている文字符号の説明のうち、適切なものはどれか?
疑問 文字符号とは?
検索したがなかなかその単語では表示されなかったために近いであろうもので理解する。
しかし今まで文字コードの説明を受けていたので文字コードのことだろうと考える。
文字符号化方式とは
コンピュータさんが使う「『文字に割り当てた番号』と『実際にコンピュータさんが扱う数字』の対応表」のこと
出典 https://wa3.i-3-i.info/word15292.html