インフラ運用・クラウド運用と運用設計の関わり
クラウドや仮想化が普及したことで、システム運用のあり方も大きく変わりました。
本記事では、インフラ運用・クラウド運用における運用設計のポイント を整理し、監視・障害対応・設計の違いについて解説します。
📖 本記事は「運用設計の基礎知識まとめてみた」シリーズの一部です。
👉 シリーズ全体:運用設計を体系的に学ぶシリーズ|入門から実践まで
◀第1回の記事:運用とは何か?未経験でも理解できる基礎と定義整理
1. インフラ運用における運用設計
従来のオンプレミス環境では、サーバ・ネットワーク機器・ストレージなどのインフラが自社管理の対象でした。
そのため運用設計のポイントは以下のようになります。
-
ハードウェアの保守計画
交換時期や障害時の代替機手配をあらかじめ定義する。 -
監視項目の定義
CPU、メモリ、ディスク、ネットワーク帯域といったリソースを監視。 -
障害対応フロー
データセンターに駆けつける作業や復旧手順を明確にしておく。
👉 オンプレの特徴は 物理的な制約があること。設計には「ハードウェア依存の要素」が大きく影響します。
2. クラウド運用における運用設計
クラウド時代になると、インフラの多くはサービス事業者が提供・管理するため、設計の焦点が変わってきます。
主なポイント
-
責任範囲の明確化
「クラウド事業者が対応する部分」と「利用者が設計・運用する部分」を区別する(例:AWSの責任共有モデル)。 -
監視の粒度
サービスレベルでの可用性・遅延・APIエラー率など、オンプレとは異なる監視項目が必要。 -
自動化の前提
クラウドではスケールアウトや自動復旧が基本機能として備わるため、運用設計でも「手作業を減らす仕組み」を組み込むことが重要。 -
コスト管理
リソースが柔軟に増減するため、監視・アラートに「コストの観点」も含めると無駄な課金を防げる。
3. インフラ運用とクラウド運用の違い
| 観点 | インフラ(オンプレ) | クラウド |
|---|---|---|
| 保守 | 機器交換・現地対応が必要 | サービス提供者が対応 |
| 監視 | ハードウェアリソース中心 | SLA、API、サービス利用状況中心 |
| 障害対応 | 現地作業+マニュアル手順 | 自動復旧・リソース切替を前提に設計 |
| コスト | 固定資産的(初期投資重視) | 従量課金(利用状況を監視・最適化) |
👉 運用設計では、この違いを理解した上で 「人がやる部分」と「仕組みに任せる部分」 を最適化することが求められます。
4. 運用設計で押さえるべきクラウド特有のポイント
-
冗長化設計
マルチAZ、リージョン分散などを前提にする。 -
IaC(Infrastructure as Code)の活用
TerraformやCloudFormationを用いて、運用手順そのものをコード化。 -
障害シナリオのテスト
カオスエンジニアリングのように「わざと障害を起こす」テストで運用設計の有効性を検証。 -
セキュリティ監視
ID・アクセス管理、ログ監査、脅威検出を含めた設計が必須。
まとめ
- オンプレの運用設計は「物理機器の管理」と「人による復旧」が中心。
- クラウドの運用設計は「責任範囲の分離」「自動化」「コスト最適化」がポイント。
- 時代に合わせて、運用設計の視点も ハードウェア中心 → サービス中心 へシフトしている。
参考
本記事は以下のサイトを参考に要点を整理しました。
◀ 前の記事:運用設計の価値とメリット ― しないと何が起きるのか?