現在勉強している基本情報技術者試験についてまとめたものです。
自分のアウトプット用なので見やすさなどは期待しないでください。
ファイル形式
ファイルとはデータを一つの塊として記録するために使う単位で、そのファイルを作成したアプリケーション以外では読み込めない独自フォーマットのファイル形式と、多種多様な環境でデータのやり取りを行いたい場合に使用する共通フォーマットのファイル形式がある。
共通フォーマットとして広く使用されているファイル形式には下記がある。
・テキスト形式・・・文字コードと、改行やタブなど一部の制御文字のみで作られるファイル形式。
・CSV形式・・・基本的にはテキスト形式だが、ここのデータである文字や数字をカンマで区切り、行と行を改行で区切ることで、表形式のデータを保存することに特化したファイル形式。
・PDF・・・画像が埋め込まれた書類を、コンピューターの機種やOSの種類に依らず、元の通りに再現して表示することができる電子文書のファイル形式。
画像用のファイル形式 | |
---|---|
BMP | 画像を圧縮せずにそのまま保存するファイル形式で、画像は一切劣化しないがファイルサイズが大きくなる。 |
JPEG | 写真を保存するのに向いているファイル形式で、不可逆圧縮を行うため、圧縮のレベルに応じて画像が劣化する。 |
GIF | イラストやアイコンなどの保存に適した画像圧縮形式で、可逆圧縮であるため画像の劣化はないが、扱える色数が256色までという制限がある。 |
PNG | フルカラーを扱える上に可逆圧縮であるため画像の劣化もないという、ある意味万能な画像圧縮形式だが、単純な圧縮率ではJPEGの方が勝る。 |
音声用のファイル形式 | |
---|---|
MP3 | 音声を圧縮して保存するファイル形式で、人に聞こえない範囲の信号を削り落とすことでデータ量を削減するなど、不可逆の圧縮を行う。 |
MIDI | 音声そのものではなく、ディジタル楽器の演奏データを保存することができるファイル形式。 |
動画用のファイル形式 | |
---|---|
MPEG | 動画を圧縮して保存するファイル形式で、不可逆圧縮を行う。 |
圧縮されたファイルを開くときは、逆方向の伸張という展開作業を行なって、元のデータを復元する。
元々のデータを間引く形で圧縮したものは、伸張後も厳密な意味の元と同じデータにはならず、このような圧縮方法を不可逆圧縮と呼び、戻せる場合は可逆圧縮という。
ディレクトリ
ディレクトリ
ファイルをグループ化して整理するもので、補助記憶装置の中はディレクトリで管理されている。
階層構造の一番上位に位置するディレクトリをルートディレクトリと呼び、他のディレクトリに含まれるディレクトリをサブディレクトリと呼ぶ。
また、自分が今開いてい作業しているディレクトリのことをカレントディレクトリといい、カレントディレクトリを含む1階層上のディレクトリのことは、親ディレクトリと呼ぶ。
ファイルを指定するときは、どこのディクトリに入っており、そのディレクトリはどこにあるのかを支持しなければならない。
このファイルまでの場所を指し示す経路のことをパスという。
パスには、ルートディレクトリからの経路を書き示す絶対パスと、カレントディレクトリからの経路を書き示す相対パスという2種類の書き表し方がある。
パスを表記するにあたって、次の決まりがある。
- ルートディレクトリは「/」または「¥」で表す。
- ディレクトリと次の階層との間は「/」または「¥」で区切る。
- カレントディレクトリは「.」で表す。(相対パス)
- 親ディレクトリは「..」で表す。(相対パス)
汎用コンピュータにおけるファイル
企業の基幹業務などで利用される大型のコンピュータ(汎用コンピュータ)におけるファイルは、一連のデータ(レコード)をまとめたものの集合がファイル。
汎用コンピュータの場合はOS自身がどのようにレコードを格納するかを定義づけた、ファイル編成方をいくつか用意して、プログラムに提供している。
ファイルに対して読み書きを行う際のアクセス方法については、下記の3種類がある。
・順次アクセス
先頭レコードから順番にアクセスする方法で、シーケンシャルアクセスとも呼ばれる。
・直接アクセス
任意のレコードに直接アクセスする方法で、ランダムアクセスとも呼ばれる。
・動的アクセス
順次アクセスと直接アクセスとを組み合わせた方法で、任意のレコードに直接アクセスした後、それ以降を順次アクセスで順番に処理する。
ファイル編成方の中でも、代表的なものは以下がある。
・順編成ファイル
頭から順番にレコードを記録していく最も単純な編成方法で、順次アクセスのみが可能。
・直接編成ファイル
レコードの中のキーとなる値を利用することで、直接アクセスを可能とする編成方法で、直接アドレス方式(キー値の内容をそのまま格納アドレスとして用いる方式)と間接アドレス方式(ハッシュ関数という計算式により、キー値から格納アドレスを算出して用いる方式)がある。
ハッシュ関数による計算の結果が重複することで、異なるレコードが同じアドレスで衝突してしまうことをシノニムという。
・牽引編成ファイル
牽引を格納する牽引域と、レコードを格納する基本データ域、そこから溢れたレコードを格納するあふれ域という3つの領域から構成され、牽引による直接アクセスと、銭湯からの順次アクセスという、両方の特性を備える編成方。
・区分編成ファイル
メンバと呼ばれる順編成ファイルを複数持ち、それらを格納するメンバ域と、各メンバへのアドレスを管理するディレクトリ域とで構成される編成方法。