LoginSignup
80
18

More than 1 year has passed since last update.

障害対応は寝て、食べるが大事

Posted at

障害対応

エンジニアができるだけ見たくない単語ですね。
でも人間が作っているシステムである以上おそらく避けては通れない道...

実は直近で障害対応を経験し、正直すごくしんどい思いをしました。
今回はその教訓を記事に起こしたいと思います。

障害&起こったこと

2月某日クライアントから障害報告が来ました。
幸い既に障害原因箇所が今後は動かないコードの部分だったのでシステム自体の改修はありませんでした。

ですが、障害報告として対象データの洗い出しを行う必要がありました。
結構対象データの件数もあったのですが、粛々と対象しないといけないです。
一通り調査し、報告したところ トラブル発生 ...

調査結果に不備が見つかってしまいました。。。。
障害が起きている時点でクライアントは結構噴火寸前。
もちろん厳しいお言葉をいただきました。。。。

その後も続く調査&報告....そして厳しいお言葉の数々。
今まで障害対応は何度かやってきましたが、
まーうまくいかない。。。

終わってみて気づきました。やっちゃいけなかったことの数々...
みなさんしっかり見てくださいね。
結構あるあるだと思います。。。。

やっちゃいけないことその1:「人としての生活を崩壊させる」

本当に気をつけないといけないことですね。
というか障害対応あるあるな気がする。。。。

そんな私も↓のようになってました。

  • 睡眠時間ほぼなし、昼夜問わず障害データと向き合い続ける
  • ご飯なんかほぼ食べない(1日でコップ1杯の水&リポD&ハッピーターン数枚)
  • ずっと部屋に篭りっきり

おかげさまでイライラするし(お腹空きすぎ)、頭は痛い(睡眠不足)
そして何よりパフォーマンスが明らかに下がってるんですよね。
思考が巡らないというかなんというか。

やばい状況だからこそ冷静でいないといけないのに
睡眠・食事をちゃんと摂らないと本当に冷静になれないです。
そしてめっちゃポンコツになります。
なので障害が起きたらまずやることはご飯を食べて寝る。
絶対やってほしい。

もちろんそうもいってられない状況もあるので一概にやるってことはできないと思います。
ですが、長期戦になればなるほどやらないといけないことだと今回本当に思いました。

やっちゃいけないことその2:「調査を内部で完結させる」

これはクライアントとの関係次第なのかな。。。
今回の場合は本音でぶつかればちゃんと一緒にやってくれるすごいいいクライアント様でした。

ですが、「障害 = 開発している私たちの瑕疵」という意識が拭えなかったため
調査も確認も全部こちら側のみで、データのみをお渡しするということをしていました。

まあ、何事もなければ内部のみでやって正式な結果を渡すでいいと思うんです。
でも今回は「調査結果不足」ということになってしまいました。
こうなってくると「調査したのはそちら側だけだから不足しているのはそちらが全て悪い」って感じになってくるんです。

なのでこういう調査とか報告は必ずクライアントを巻き込んだ方がいいなと思いました。
クライアントを巻き込んで調査すると、お互いに調査しあって不足してたとしても、
「お互い様だよね」って思ってもらえるので正直あんまり詰められないです。
そして何といっても「一緒に障害を乗り越えた」という気持ちがあるので
気持ち的にこちらが楽です(笑)

やっちゃいけないことその3:「クライアントに調査データがわかりづらい報告」

今回これも厳しいお言葉の引き金だったじゃないかなと思ってます。。。。

まず次の2つの表を見てもらいたいです。

悪い例

障害対象 調査結果
-
xxxのため障害対象データ

いい例

障害対象 調査結果 調査データ1 調査データ2 調査データ3
- xxxxx yyyyy zzzzz
調査データ3がnullのため障害対象データ xxxxx NULL NULL

みなさんどうでしょう。。。
気をつけるポイントとしては

  • 調査結果の根拠となるデータが一緒にあるか
  • 調査理由が根拠となるデータを元にした理由となっているか
  • 調査結果となる表が見やすいか(色をつけてあげたり、太字にしたり....)

基本的に調査結果を見るクライアントはDBのデータを見れないということの方が多いと思います。
だからこそ調査の根拠となるデータをこちらから出してあげないと
クライアント的には「何を根拠に....」と正直不安ですよね。。。
しっかりと根拠となるデータをつけてあげてかつわかりやすくしてあげれば
「しっかり調査してくれてるな」
「こういう理由で障害対象データなのね」
と理解していただける。

何よりちゃんとやってる感があるので今後の信頼に繋げていけるかなと思いました。

結論

ちょっと長くなっちゃいましたが、今回割と本気で追い込まれました。
でもきっとこういう経験する人は今後もいるはず。

そういう人たちに言いたいことは
「ちゃんと食べて、ちゃんと寝て!!!」
そして障害終わったら自分にご褒美たくさん買ってね!!!

以上!

80
18
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
80
18