「團隊能夠輕鬆且快速地從故障中恢復,而不是去假設可以完全避免故障。」——《基礎架構即程式碼:管理雲端伺服器》
有經驗的工程師都知道,風險是難以降低到零的。
與其想要找出一套方法來消除所有風險,倒不如學習 DevOps 與 SRE 所提倡的文化及觀念;
主動擁抱故障、變更、異常事件,將它們視為是再正常不過的事情;
努力提升團隊的韌性與反脆弱性;
讓團隊不僅能做到快速恢復,還能從中學習並變得更強大。