信頼性の高いシステムとは、故障しにくく、24時間365日動き続けるシステムです。信頼性の高いシステムはフォールトトレランスやフォールトアボイダンスという考え方に基づいて構築する必要があります。また、万が一障害が発生した場合に、市ステムを安全に停止させることが最優先なのか、それとも、性能を落としてデモシステムを動かし続けることが最優先なのかを考えて対策を取っておく必要もあります。
1:フォールトトレランス
障害が発生してもシステムの動作を継続できるように対策しておく考え方をフォールトトレランスと言います。また、フォールトトレランスの考え方を採用したシステムをフォールトトレラントシステムと言います。フォールトトレラントシステムでは、同じ役割を担う装置を複数装備して、1つが故障しても残りの装置で代替できる構成にします。同じ役割を担う装置を複数装備する構成を助長構成といいます。
2:フォールトトレラントシステムの構成
フォールトトレランスとシステムには、デュプレックスシステムやデュアルシステムがあります。
①デュプレックスシステム
本番系(現用系)と待機系(予備系)を用意して二重化する。通常は本番系を稼働させ、本番系に障害が発生した時に待機系に切り替える。
②デュアルシステム
複数系統を同時に稼働させて、結果を常時照合する。障害が発生した時には、診断プログラムを実行して障害部分を特定し、障害部分を切り離して動作を継続する。デュプレックスシステムよりも高い信頼性を実現できる。同じ処理を行うシステムを二重に用意し、処理結果を照合する。
デュプレックスシステムでの待機系の待機方法には、ホットスタンバイ、ウォームスタンバイ、コールスタンバイがあります。
復旧までの時間:ホット>ウォーム>コールドの順。
1:ホットスタンバイは、利用者が気づかない程度の時間で待機系に切り替える方法です。待機系には本番系と同一のOSやアプリケーションソフトウェアをインストールし、常に最新のデータを反映させておきます。待機系は常に起動してお息、即時に切り替えられるよにして障害の発生に備えます。
2:コールスタンバイは、切り替えに時間を要します。障害が発生してから、待機系にOSやアプリケーションソフトウェアのインストールを行い、その後、最新のデータを反映させる作業を行います。
ウォームスタンバイは、ホットスタンバイとコールスタンバイの中間レベルで待機系を準備しておく方法です。
3:フォールトアボイダンス
各装置の故障率を極めて低くして、障害の発生そのものを防ぐという考え方です。故障率の極めて低い装置はコストが高くなりますから、フォールトアボイダンスでシステムを構成するとコストが高くなります。例えば、人工衛星は、スペースや重量の制約が厳しく、同じ装置を複数装備することが困難です。こういった用途では、フォールトアボイダンスでシステムを構築します。情報システムは、コストの面からフォールトトレランスで構築することが一般的です。
4:フェールセーフとフェールソフト
フェールセーフは、故障時にシステムをできる限り安全な方向へ導くという考え方です。システムを停止させることももやむを得ないと考えます。
フェールソフトは、故障した部分を切り離し、機能を低下させてでも、システムの動作を継続させるという考え方です。機能がした状態でシステムが動作することを縮退運転(フォールバック運転)と呼びます。
5:フールプルーフ
ご入力や誤操作といった人偽的なミスが発生しにくいように設計するという考え方です。
試験の出題例:フールプルーフとは、「利用者が誤った操作をしても、システムに異常が起こらないように」設計する。
6:フォールとマスキング
システムが故障した場合でも、故障していることを表面的に出ず、外部から分からないようにすることです。システムの故障が他のシステムに影響を与えないようにするのです。