「維運團隊必須要有足夠的時間撰寫自動化維運程式,否則就會被維運工作所淹沒」——《網站可靠性工程》
隨著需要維運的系統及服務越來越多、也越來越複雜;維運團隊經常會因此陷入雙拳難敵四手的狀況。
每一位維運工程師或系統工程師身上都扛了多個系統,每天光是盯著哪個系統又從綠燈變成黃燈或紅燈就夠忙了,更不用說還有各種例行的維運工作或臨時的異常事故。
《網站可靠性工程》提倡要讓 SRE 團隊擁有足夠的時間去改善系統維運工作,讓團隊可以用更自動化、具備自癒能力且可靠的方式來維運系統,避免團隊的時間總是消耗在手動、重複性的維護工作,最終陷入無力負擔的死胡同。
『持續改善』的精神不只要落實在軟體開發,同時也需要落實在系統維運。
維運也是一項需要更多良好工程實踐的專業領域,以『專業』來替代『苦力/努力』去對抗日趨增加的系統複雜性。