2026/03/20

2026-03-20.png

「下次遇到 P0 事件,也許去廟裡求神問卜一下,也是一種不錯的選擇呢。」——《SRE工作現場直擊!:維運起點x實戰經驗x職涯規劃面面觀》

軟體開發就像蓋教堂,當完成後,我們就開始祈禱。

我覺得這句話也可以套用在軟體維運及系統維運,當輪值半夜 on-call 時,你一定也會祈禱今晚可以順利度過。

不論是誰 on-call,在面對負責的軟體系統發生事故時,最忌諱的不是技術能力不足,而是慌亂、甩鍋、或是憑感覺亂試。

在混亂的事故現場,最怕的是錯把自己的亂猜,誤認為是出自專業經驗而產生的直覺反應,不但沒解決問題,反倒好心做壞事。

這就是為什麼 DevOps 與 SRE 會如此重視監控、日誌、指標,又或者是越來越多人提到的 Observability。

當你擁有的資訊越充足,你才能越有依據,去做出合適的決策,而不是真的需要去「通靈」或「求神問卜」。

意外事故很可怕,但就是這麼真實且直接的告訴你,你那自以為完善的軟體系統就是有你未曾發現的盲點。

哎,做了這麼多,還是避不了所有的風險,果然我們還是開始祈禱或求神問卜吧?(咦)