2025/12/20

12-20.png

「每一次的異常,都是一次更靠近真相的機會。」——《Grafana zero to hero:從視覺化到智慧監控,打造全知視角的可觀測性平台》

工程師該如何提升自己對於系統的掌握度呢?

也許,把系統搞砸會是一個不錯的方式!?

當然,這並不是要你真的沒事自己去把 Production 環境弄壞,但假如它真的不幸發生了異常,那可千萬不要浪費了從中學習的機會。

在《SRE》書中也提過類似的觀點,惟有深入調查系統為何無法正常運作才能讓我們成為該系統的專家。

每一次的異常,固然會為企業帶來損失,但如果企業連從中學習的機會都不把握,那無疑是為自身帶來二度的損失,並且替未來埋下更多的風險。