目次
はじめに
基本情報技術者試験の勉強をしていて、MTBFとMTTRという用語が登場し、どちらが「故障間隔」でどちらが「修理時間」なのか混乱してしまうことがありました。稼働率の計算問題では両方の指標を正確に理解していないと解けないため、しっかり整理する必要性を感じました。今回は、MTBFとMTTRの違いや計算方法、覚え方について、備忘録としてまとめます。
一覧表
| 指標 | 正式名称 | 意味 | 改善の方向 |
|---|---|---|---|
MTBF |
Mean Time Between Failures | 故障と故障の間の平均時間 | 増加させる |
MTTR |
Mean Time To Repair | 故障から修理完了までの平均時間 | 減少させる |
| 稼働率 | Availability | システムが正常に動作している割合 | 増加させる |
MTBFとMTTRの基本定義
【MTBFとは】
MTBF(Mean Time Between Failures)は、「故障と故障の間の平均時間」を表す指標です。日本語では「平均故障間隔」と呼ばれます。
英語を分解すると以下のようになります。
- Mean(ミーン)は「平均」
- Time(タイム)は「時間」
- Between(ビトウィーン)は「〜の間」
- Failures(フェイリアーズ)は「故障」の複数形
この指標が大きいほど、システムが長期間安定して稼働していることを意味します。例えば、MTBFが1,000時間であれば、平均して1,000時間ごとに故障が発生するということです。
【MTTRとは】
MTTR(Mean Time To Repair)は、「故障が発生してから修理が完了するまでの平均時間」を表す指標です。日本語では「平均修理時間」と呼ばれます。
英語を分解すると以下のようになります。
- Mean(ミーン)は「平均」
- Time(タイム)は「時間」
- To(トゥ)は「〜までの」
- Repair(リペア)は「修理」
この指標が小さいほど、故障から復旧までの時間が短く、システムの停止時間が少ないことを意味します。例えば、MTTRが2時間であれば、平均して故障から2時間で復旧できるということです。
身近な例で理解する
オフィスのコピー機を例に考えてみます。
あるコピー機が以下のような状態だったとします。
- 1月に故障して、修理に3時間かかった
- その後、150時間正常に稼働した
- 2月に再び故障して、修理に5時間かかった
- その後、250時間正常に稼働した
- 3月にまた故障して、修理に4時間かかった
この場合を整理すると以下のようになります。
- 故障間の稼働時間は150時間と250時間で、平均200時間
- 修理時間は3時間、5時間、4時間で、平均4時間
つまり、このコピー機のMTBFは200時間、MTTRは4時間ということになります。「平均して200時間ごとに故障し、修理に4時間かかる」という状態です。
計算方法と具体例
【MTBFの計算式】
MTBFは以下の式で計算できます。
MTBF = 総稼働時間 ÷ 故障回数
【MTTRの計算式】
MTTRは以下の式で計算できます。
MTTR = 総修理時間 ÷ 故障回数
【具体的な計算例】
あるサーバーが1年間(8,760時間)で以下のような状態だったとします。
- 故障回数は10回
- 修理にかかった時間の合計は50時間
- 実際に稼働していた時間は8,710時間
この場合の計算は以下のようになります。
MTBFの計算
MTBF = 8,710時間 ÷ 10回 = 871時間
MTTRの計算
MTTR = 50時間 ÷ 10回 = 5時間
このサーバーは、平均して871時間ごとに故障し、修理に平均5時間かかるということが分かります。
稼働率との関係
【稼働率の計算式】
稼働率(Availability)は、システムが正常に動作している時間の割合を示す指標で、MTBFとMTTRを使って以下のように計算できます。
稼働率 = MTBF ÷ (MTBF + MTTR) × 100
この式の意味を分解すると以下のようになります。
- 分子のMTBFは「稼働時間」
- 分母の(MTBF + MTTR)は「稼働時間 + 修理時間」で「全体の時間」
- つまり「全体のうち、稼働している時間の割合」を計算している
【計算例】
先ほどのサーバー(MTBF = 871時間、MTTR = 5時間)の稼働率を計算してみます。
稼働率 = 871 ÷ (871 + 5) × 100
= 871 ÷ 876 × 100
= 99.43%
このサーバーの稼働率は約99.43%ということになります。
【稼働率を上げるには】
稼働率の式を見ると、稼働率を上げるには2つの方法があることが分かります。
- MTBFを大きくする(故障間隔を長くする)
- MTTRを小さくする(修理時間を短くする)
どちらも分子が大きくなる、または分母が小さくなることで、稼働率が向上します。
改善時の計算の違い
MTBFとMTTRは、改善の方向性が異なります。ここが混乱しやすいポイントです。
【MTBFの改善】
MTBFの改善は「増加」を意味します。故障間隔が長くなることで、システムの信頼性が向上します。
改善前の例
- MTBF = 500時間
- MTTR = 5時間
- 稼働率 = 500 ÷ (500 + 5) × 100 = 99.01%
改善後の例(MTBFを2倍に改善)
- MTBF = 1,000時間(改善で増加)
- MTTR = 5時間
- 稼働率 = 1,000 ÷ (1,000 + 5) × 100 = 99.50%
【MTTRの改善】
MTTRの改善は「減少」を意味します。修理時間が短くなることで、ダウンタイム(停止時間)が減少します。
改善前の例
- MTBF = 500時間
- MTTR = 5時間
- 稼働率 = 500 ÷ (500 + 5) × 100 = 99.01%
改善後の例(MTTRを半分に改善)
- MTBF = 500時間
- MTTR = 2.5時間(改善で減少)
- 稼働率 = 500 ÷ (500 + 2.5) × 100 = 99.50%
混同しないための覚え方
MTBFとMTTRを混同しないためのコツをいくつか紹介します。
【キーワードで覚える】
- MTBF → Between(間)→ 故障と故障の「間」の時間
- MTTR → Repair(修理)→ 「修理」にかかる時間
英単語の意味に注目すると、どちらが何を測っているのか思い出しやすくなります。
【改善の方向で覚える】
- MTBF → 「長く稼働する」方が良い → 増やす
- MTTR → 「早く直る」方が良い → 減らす
「どっちを増やして、どっちを減らすのか」を覚えておくと、計算や分析の際に間違いにくくなります。
【イメージで覚える】
- MTBF → 「故障しない期間」→ 長い方が嬉しい
- MTTR → 「システムが止まっている時間」→ 短い方が嬉しい
ユーザー目線で考えると、直感的に理解しやすくなります。
よくある間違いと注意点
【単位を揃える】
MTBFとMTTRを計算する際、単位を揃えることが重要です。
- MTBFが「時間」単位なら、MTTRも「時間」単位にする
- MTBFが「日」単位なら、MTTRも「日」単位にする
単位が異なると、稼働率の計算が正しくできません。
間違った例
MTBF = 30日
MTTR = 4時間
稼働率 = 30 ÷ (30 + 4) × 100 ← 単位が異なるため不正確
正しい例
MTBF = 720時間(30日)
MTTR = 4時間
稼働率 = 720 ÷ (720 + 4) × 100 = 99.45%
【改善の方向を間違える】
「MTBFを減らす」「MTTRを増やす」といった表現は誤りです。
- MTBFの改善は「増加」(より長く稼働)
- MTTRの改善は「減少」(より早く復旧)
報告書や会議で「MTTRを向上させる」と言うと、「修理時間を長くする」という意味になってしまうため注意が必要です。正しくは「MTTRを短縮する」「MTTRを改善する」といった表現が適切です。
【MTBFに修理時間を含めない】
MTBFは「稼働時間」のみを測定する指標です。修理時間(ダウンタイム)を含めて計算すると、正しい値が得られません。
間違った計算
総時間8,760時間、故障10回、修理時間合計50時間の場合
MTBF = 8,760 ÷ 10 = 876時間 ← 修理時間を含んでいる
正しい計算
MTBF = (8,760 - 50) ÷ 10 = 871時間 ← 稼働時間のみで計算
関連用語
【MTTRの別定義】
MTTRは文脈によって異なる意味で使われることがあります。
-
Mean Time To Repair(平均修理時間)→ 修理作業そのものにかかる時間 -
Mean Time To Recovery(平均復旧時間)→ 故障検知から復旧までの全体時間 -
Mean Time To Response(平均応答時間)→ 故障検知から対応開始までの時間
一般的には「Repair」の意味で使われることが多いですが、組織やシステムによって定義が異なる場合があるため、確認が必要です。
【可用性(Availability)】
可用性は、システムが要求されたときに正常に動作する能力を示す概念です。稼働率と同じ意味で使われることが多く、MTBFとMTTRから計算されます。
高可用性システム(High Availability System)では、稼働率99.9%以上(いわゆる「スリーナイン」)や99.99%以上(「フォーナイン」)が求められることがあります。
【ダウンタイム】
ダウンタイムは、システムが停止している時間の総称です。MTTRと密接に関連しており、ダウンタイムを短縮することはMTTRの改善につながります。
計画的なメンテナンスによるダウンタイムと、予期しない故障によるダウンタイムを分けて管理することもあります。
まとめ
MTBFは故障間隔を、MTTRは修理時間を示す指標で、どちらもシステムの信頼性を測る上で重要です。MTBFは増加させ、MTTRは減少させることで、稼働率の向上につながります。