前書き
こちらの記事をお開きいただきありがとうございます。
当記事では、現役でインフラ運用保守に参画する私が、身バレや機密漏洩しない程度に色々めんどくさいお話をするだけの記事となります。
一応、誤解の無いようにしておきたいのですが、得られるものもちゃんとあります。
今回は、
面倒くさいポイント→得られるもの
というような構成で話を進めていきたいと思いますので、下記スペックをお持ちの方、
どうぞゆったりとお読みください。
当記事を読む必須スペック
駄文を温かく見守る心
推奨スペック
Linuxコマンドの知識(最高でもLPIC1程度、かじっただけ、初学者でも可)
文章から情景を想像し、共感してくれる方
障害発生時(面倒くさいレベル1)
大丈夫です。大抵は2重3重の冗長があるので、すぐにお亡くなりコースはありません。
一概に障害=ダウンというわけでも無いですし。
ただし、原因の切り分けはしなきゃいけません。
ls,cd,ls,したのち、catもしくはmoreやtail等でログ確認。
何しろターミナル画面なので、ブワーっとログが出てきますが、だいたい見るところなんか限られてます。
え?その見るところがわからんから大変だ?ごもっともです。。。面倒くさいですよね。
時と場合によってはgrepしたりもしますが。
この話の得られるもの
ログと仲良くなれます。さらには即興でコマンド+引数という実戦経験
も積めます。わあい!
ベンダ修理必要時(面倒くさいレベル2)
障害発生のなんやかんやの末、例えばストレージとか、その他部品を変えなきゃいけないケースも出てきます。
修理そのものは手順書がありますが、こういう部品交換系の場合、部品そのものを変えるのはベンダだったりするので、ベンダ調整が必要です。
それでも修理が溜まってて、昨今の有給消化義務やコロナ影響もあり互いの体制が手薄な場合もあるので、
ベンダ調整の際は、自分たちの稼働状況+ベンダの状況も加味して調整しなければなりませぬ。
さらには冗長の都合もありますので、
「放っとくともう一個死んだらアウト、これはまだまだ大丈夫」
「これは監視系だからまだいいけど、こっちは実サービス系だから早く直さないと」
もちゃんと知っておかなければなりません。
面倒くさいですねえ。
この話の得られるもの
諸々の条件を加味した上での人員調整スキル(結構、汎用スキルかも?)
自分たちだけでやる修理の場合(面倒くさいレベル3)
部品交換が絡まなければ、自分たちでできます。
え?だったらさっさとやればいいじゃん、って?
ところがそうもいかないのがインフラ。(インフラも様々ですけどね)
自部署、他部署の偉い人たちに、
「ワイらの作業がどれだけ安全、リスクヘッジバッチリか」
を説明しなければなりません。
そんなのが一堂に会する中で、私たちよりも遥かに化物スキル
であったが為に出世した偉い人たちの前で精一杯の説明をし、一緒に問題ないかを考え、承認を得なければならないのです。
ここで厄介なのが他部署の偉い人。他部署だけどちょっと知ってるが故に思わぬ角度からいろいろな質問をして頭を悩ませます。
その人を納得させられれば、勝ったも同然。(勝ち負けじゃない)
半ば余談ですが、最近、私ばっかりその説明やってるのですが、毎回やりたく無いと思ってます。ホントに。
無事に切り抜けたらその日の仕事は終了と思ってるぐらいです。
この話の得られるもの
他部署のモンスター偉い人相手に説明するメンタルと技能
さらに説明資料を作るパワポやExcelスキル(この辺も汎用スキルかも?)
最後に
色々言いましたけど、ログを嫌がらずに見れるようになって、人員調整もできて、
作業説明を偉い人たちにできて、面倒くさいことに耐えるメンタル
という素敵なスキルが身につくのが運用保守です。
決してキラキラしちゃいませんし、なんならナーバスなことの方が多いですが、
コーディング案件と違って未経験者には謎多き案件であるとも思うので、
これで少しでも想像できたら幸いです。
さあ、運用保守現場を抜ける為の勉強でもしますかね。