下請けCOBOLERとして生きていた頃のノウハウ Advent Calendar 2016の24日目ぐらいの記事です。
夜間バッチ、よく落ちるんですよね。
落ちたときの流れになります。
既知の障害か?未知の障害か?
まずはこれです、ログをしっかり見てABENDコードを確認しましょう。
いつものなら緊張感から解放されます。
(ちなみに筆者の所ではホストのディスク容量が足りなくなるというJCLエラーがよく起きていたので、そう言うときは容量を変更するジョブの申請やある程度時間をおいての再ラン指示などで乗り切ってました)
もし未知の障害ならおおごとです。
未知の障害だ!
まずはデータの取得、テスト環境での再現をしましょう。
その中で原因特定を頑張りましょう。
状況によってはそのレコードをドロップしての再ランもやむを得ません(そうだとしたらその日はストレスから解放されます。)
必要なのはアドレナリンと声だし
本番ジョブのリカバリーは時間との勝負です。
必ず作業は複眼チェック・大きな声で情報伝達・分からないときは分からないと騒ぐ、とにかく一人で悩む時間はありません、騒いで上の人に問題を認識して貰いましょう。
後はひたすらアドレナリン出してください。
集中力なくして夜は乗り越えられません。
必要以上に堅くならないこと
緊急事態というのは普段のチームの結束力が試される場面です。
メールに障害検知データのダンプを送るのに
いちいちいつもお世話になっております。から始まる定型文を付ける必要はありません。
これです。って①行と添付ファイルで充分です。
また、話をするときも多少フランクで良いと思ってます。
乗り越えた障害の数だけチームの結束力は増します。
タクシー代をもらおう!
プロパーさん都合で深夜残業なんですからタクシー代はじゃんじゃん請求しましょう。
これが一番大切なことです。