前回、ITサービスマネージャーの価値をテーマに記事を書きました。
そんなITサービスマネージャーが大活躍するシチュエーションのひとつがシステムトラブル発生時です。
今回は、システムトラブル発生時にITサービスマネージャーがとるべき対応について書いてみたいと思います。
システムトラブル発生!まず何をする?
運用保守端末の画面にエラーメッセージが出力され続けている…
電話が鳴り止まない…
システムトラブルが発生した瞬間、どのような行動をとりますか?
まずはメンバを召集し、トラブルからの早期復旧のため原因解析に全集中!メンバ全員で分析!
…となりがちですが、同時に、お客様業務やユーザへの影響範囲を見極めることが重要です。
ITサービスマネージャーとして、システムで実現すべきお客様やユーザの業務を成り立たせていくことが大切なミッションだからです。
何が起きている?マシン室から視野を拡げよう。
システムトラブル発生時にはマシン室でモニターとにらめっこになりがちですが、多角的に状況を把握することも大切です。
私の場合は長く公共系システムを担当していましたので、システムトラブル発生時には初動として、Twitter(X)で該当サービスをキーワード検索し「使えない!」とつぶやかれていたりしないか、ユーザからの問合せを受け付けるコールセンター部門に似たような電話がきていないかヒアリングする等の点検を行っています。
このように、マシン室から視野を拡げて、いま何が起きているかを多角的に把握することが重要です。
一手先、できるなら二手先を考える。
メンバが全力で目の前の対応をしているときでも、ITサービスマネージャーは「次に何をするか」を考え始めるべきです。
例えば、メンバの関心が原因分析に集中しているときには「次は対処の検討が必要になるから関係者を召集し○時に会議を設定しておこう」とか、
対処検討が終わり実行待ちのフェーズでも「対処が終わったらお客様への報告が必要だから、終わった前提で報告文書を作り始めておこう」と先々のことに考え及んでおくことが迅速なトラブル復旧に繋がります。
まとめ
このようにITサービスマネージャーには、運用保守現場を仕切る役割だけでなく、大局的かつ将来を見据えたアクションが求められます。
システムトラブルが発生したときこそ、落ち着いた判断と前向きな行動でITサービスマネージャーが本領発揮するチャンスなのです。