0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

AWSクラウドプラクティショナー学習メモ】耐障害性とは?可用性や冗長性との違いもわかりやすく解説

Posted at

こんにちは。miyoshiです。

AWSクラウドプラクティショナーの勉強を進めています。
今回はクラウドの特徴の一つ、「耐障害性(Fault Tolerance)」 について、
可用性や冗長性との違いも交えながら、自分の学習メモとしてまとめました。

「耐障害性って可用性や冗長性とどう違うの?」
「具体的に何を目指すの?」

という疑問がある方の参考になれば嬉しいです。

✅ 「障害」とは何か?現場でよくある障害例

まず「障害(障害発生)」とは、、、、

システムやサービスの正常な動作を妨げるあらゆる問題やトラブルのことです。

障害として起こりそうなこと

障害の種類 内容例
ハードウェア障害 サーバーの故障(CPU故障、ディスク故障、電源トラブルなど)
ソフトウェア障害 アプリケーションのバグや設定ミスによるクラッシュや異常動作
ネットワーク障害 ネット回線の断線、遅延、ルーターの故障など
人的ミス 設定変更ミス、誤操作、削除ミスなど
外部要因 電源停止(停電)、自然災害(地震や火災など)
セキュリティ事故 不正アクセスやサイバー攻撃によるサービス停止やデータ損失

これらの障害が発生すると、サービスの停止や遅延、データ消失などが起きる可能性があります。

✅ 耐障害性(Fault Tolerance)の定義

AWSやITインフラの文脈では、次のように定義されます。

障害(Fault)が発生しても、サービス全体を止めずに正常に稼働し続けられる能力

例えば、ハードウェアが壊れても別のサーバーに自動で切り替わり、
ユーザーにはサービス停止を感じさせずに動き続ける仕組みを指します。

✅ 可用性や冗長性との違い

クラウドの特徴を語るときの3セット

  • 可用性(Availability)
  • 冗長性(Redundancy)
  • 耐障害性(Fault Tolerance)

それぞれの意味は少しずつ違います。

用語 意味 イメージ(レストラン例)
可用性 どれだけ長くサービスが止まらず使えるかの割合 お店がどれだけ長く営業できるか
冗長性 予備の設備やシステムを用意しておくこと メインのキッチンが壊れても、予備のキッチンがすぐに使える状態
耐障害性 障害が起きてもシステムが止まらず動き続けられる能力 キッチンの故障時にもお店が完全に止まらず営業し続けること

つまり、

  • 可用性は「どれだけ長時間止まらず使えるか」
  • 冗長性は「予備を用意すること」
  • 耐障害性は「障害時も止まらず動くこと」

という関係になります。

✅ 耐障害性を理解するために重要な指標:RPOとRTO

耐障害性を具体的に語る上で、
RPO(Recovery Point Objective)RTO(Recovery Time Objective) という言葉が重要です。

指標 意味 レストラン例
RPO どの時点までのデータが復旧できるか、許容できるデータ損失の範囲 停電が起きた時点からどれくらい前の注文データまで戻せるか
RTO 障害発生からどれだけ早くサービスを復旧できるか 停電から何分で営業再開できるか

このRPOとRTOが短いほど、耐障害性が高いと言えます。

✅ 可用性・冗長性・耐障害性の関係

  • 可用性は、「どれだけ長時間サービスが使えるか」の指標
  • 冗長性は、耐障害性や可用性を高めるための「予備の仕組み」
  • 耐障害性は、「障害があってもシステムを止めない・復旧を早くする」

✅ AWSでの耐障害性を実現する仕組み

AWSでは、耐障害性を高めるために次のような仕組みが用意されています。

  • マルチAZ構成:複数の独立したAZにシステムを分散し、障害時も別AZが引き継ぐ
  • 自動フェイルオーバー:障害を検知して自動的に別システムに切り替える機能
  • バックアップとスナップショット:データの定期保存により、RPOを短く保つ
  • 監視・アラート:異常検知で迅速な対応を促す

これらにより、AWSは高い耐障害性を持つインフラを提供しています。

✅ まとめ(学習メモ)

  • 可用性=結果(どれだけ止まらなかったかという実績・稼働率)
  • 冗長性=手段(止まらないように予備を用意する設計)
  • 耐障害性=能力(障害が発生してもユーザー影響なしに動き続ける力)
  • RPO(データ復旧点)RTO(復旧時間) は耐障害性を具体化する重要な指標。
  • AWSのマルチAZ構成や自動フェイルオーバーなどの仕組みで耐障害性を高めている。

✍️ 次回は「従量課金制」について整理予定です!

AWSクラウドプラクティショナーを学ぶ皆さんの参考になれば嬉しいです。
ご感想やご質問があればぜひ教えてください!

コツコツ学習頑張ります。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?