ITのインフラ系の仕事をしてますが今週は事件発生(ToT)
開発用の小さなシステムではありますが、そのインフラを構成するサーバーが障害で壊れてしまいました。
1ヶ月後に予防保守で交換を予定してましたが、あと1ヶ月まできたところでまさかの。
復旧もといリプレース先のインフラ構築を予定よりもかなり急ピッチで、まきまきのまきで進めることに。
やってみると、作業を進める中で分別の必要なことが多かったです。
障害点の切り分け、新しいシステムを動かすために何を作る必要があるか、動作確認のポイントの洗いだしなどなど、分別すべき点がたくさん。
このあたりのことは物理的な構成やミドルウェアの設計などシステムの構成を理解してないと分別するのが難しく、チーム内でもわかる人が限られてました。
ですがなんと以前勉強がてら把握していたことや、身につけた知識がここにきて役立つようになりました。
分別を助ける知恵を生み出すことに繋がり、対応が急がれるなか短時間でテストの観点を素早く分別するに至り、動作確認をしっかりと行ったうえでスムーズにサービスインすることに繋がりました。
無事リリースできてひと安心です。
私含め数人がメインで対応、ある日は夜遅い時間までがんばりました。
その様子を見ていたお客さんから、遅くまで本当にありがとうとお礼の言葉をいただきました。
共に対応してくれた同僚の方々にも感謝ですし、分別の知恵と最後まで行う力をくださった神様に感謝します!
コメント