每日一句
2026 年 06 月 12 日
「管理正式環境服務的殘酷現實,意味者壞事偶爾會發生,而您不得不談論到肇因。」——《網站可靠性工程工作手冊》
(正體中文版書中原文是「生產環境」,筆者引用時改為個人比較喜愛的「正式環境」。)
正式環境,就是那個不管你做了多少準備,總是有可能發生壞事的環境。(喂~)
服務、程式、甚至是你覺得最不會出錯的底層雲端供應商,只要是面向使用者的正式環境,都逃不過莫非定律,總是在你最不希望出錯的時候發生噩耗。(喂喂~)
所以,接受這個殘酷的現實吧,你避不了要面對正式環境的異常現象,還是儘早建立一個正確的心態。
壞事總是會發生,幫助團隊可以正確的面對它、接受它、放下它。
Blameless Postmortem,讓團隊可以冷靜面對、認真探討根本肇因,找出系統與流程中真正的弱點,這也是一種持續改善精神的具體作為。
你們團隊能夠心平氣和的從事故中學習經驗嗎?前人的踩雷經驗是如何傳承給後人的呢?