系(system)障害連絡は、早い方が良いというのは、いくつかの記事で書かれています。
本当でしょうか。
大事なのは、方法、手段、手順などについて、色々な組み合わせを用意していて、
その重大度に応じて、使い分けれているかどうかではないでしょうか。
障害の方法、手段、手順の使い分けは、
障害の重要度に応じて異なります。
「まず連絡を」という記事を時々見かけます。
待ってください。
連絡したら、主系から代替系への切り替えが障害をもたらす場合や、もっと障害が大きくなる場合があります。
「まず連絡を」を鵜呑みにしないようにしましょう。
直感的に「まず障害の重要度を切り分け」ましょう。
1)代替系に切り替える場合(代替系への切り替えが自動または短時間で済む場合)
代替系に切り替えてから連絡しましょう。
2)代替系に切り替え場合(代替系への切り替えが一定時間かかる場合)
代替系の切り替えの予定時間に応じて、あらかじめ決めておいた非常系を使って連絡を取りましょう。
3)様子を見る場合
影響の大きさに応じて、連絡する範囲を絞り、その連絡の結果、障害に対して影響が大きくなるかどうかで、次に連絡する範囲を決めましょう。
4)代替系への切り替えに失敗して、非常系で連絡を取る場合
あらかじめ決めておいた、代替系への切り替え失敗の連絡を取りましょう。
5)代替系への切り替えに失敗しただけでなく、非常系も一部は使えないことが発覚した場合
あらかじめ、非常系が使えない場合を想定した連絡方法を取りましょう。
1 障害の重要度分類
障害の重要度分類は、対象とする系(system)によって異なります。
止まると人命を失う可能性がある系と、経済的打撃が大きい系と、代替手段が用意できており、規定の時間以内に回復すれば、障害が起きたこと自体を通知する必要がない系では全く異なります。
代替手段が用意できていても、代替手段への切り替えの費用、危険性が、現在の障害の程度より大きければ、代替手段への切り替えを行わずに、警告だけ先に発します。
代替手段への切り替えが即時にできて、何の影響もなく切り替えが完了すれば、警告を発する必要はありません。
ここでは、ある人命には影響はないが、経済的には数分止まれば大きな影響を業務用の系での重要度分類を考えてみます。人命に影響を与える場合は、最後に例を示します。
1.1 重要度大(人命への直接影響がない場合)
1.1.1主系が落ちる(system down)
一番鍵となる系が落ち、その代替の系への切り替えも失敗した場合。
大事な処理は実行できず、主系が落ちた場合の補助系への切り替えで、
静的なWEB表示(申し込みなどはできず、企業紹介、無償の資料などを落とすことはできる)はしている。
1.1.2 主網が落ちる(network down)
網が落ち、代替網への切り替えも失敗した場合。
ここでは、主系と代替系の2つの系統が自動切り替えまたは手動切り替えで動く場合を想定しています。網も主網と代替網の2つを、主系と代替系のそれぞれに切り替えられるようになっている場合を想定しています。
非常系とは、主系、代替系と独立した連絡網を指します。
人命に影響を与える系(system)
人命維持装置など電気・計算機網で構成している系では、電源、計算機および網の障害時の連絡方法を記録。
電源断
非常電源装置への切り替え、発電装置の起動など、定期的に訓練を行っていないと、何が起きるかわからない。
非常電源装置、発電装置を1年以上使っていないと、いつの間にかその部屋への出入り口が塞がれていて、異常があって入ろうとして入れないとか。
出入り口の鍵がどこにあるのかわからずに扉を壊すとか。
そんな馬鹿なという人は、何か起こると想定外といって責任逃れをしようとする人。
専門家であれば、「想定外」という言葉は使わない。
網断
一部のネットワークが繋がらなくなたら、二重系にしていてもう一方を使う。
しかし、しばしば二重系の両方が使えなくなることがある。
その場合に用意しておくのが非常系。
二重系とは異なる技術、異なる手段で用意する。
有線の二重系が光網と金属網からなっている場合には、非常系は無線網にするとか。
## 保守要員不在
保守の要員が倒れたりして、人間が対応しないといけない警告処理ができない状態になっていたらどうでしょう。電話をかけても出ない。
生体反応センサをつけて生存確認するか、1時間に1度は何か入力しないといけない作業手順にしておいて、反応がなければすぐに連絡して、連絡がとれなければ、すぐにかけつけるか、操作の主導権を人のいるサイトに移すか。
# この資料は書きかけです。順次追記します。
参考資料
効率的なHAZOPの進め方
https://qiita.com/kaizen_nagoya/items/2b8eae196945b7976446
ちょけねこ たんじょうびのおくりもの
https://qiita.com/kaizen_nagoya/items/fc9675686c229f7a155e
安全分析における HAZOP-TRIZ連携の試み
https://www.slideshare.net/kaizenjapan/hazop-and-triz-byoffor-the-children13
安全・安心分析の HAZOP による統合的運用
https://www.slideshare.net/kaizenjapan/hazop-and-othere-analysis-method-include-stamp-and-fram
安全分析において、HAZOP, FMEA, FTAの組み合わせによる リスクアセスメントの進め方の検討
https://www.slideshare.net/kaizenjapan/hazop-and-triz-byoffor-the-children13
文書履歴
ver. 0.10 初稿 20180707
ver. 0.11 表現訂正 20180814
最後までおよみいただきありがとうございました。
いいね 💚、フォローをお願いします。
Thank you very much for reading to the last sentence.
Please press the like icon 💚 and follow me for your happy life.