2025/12/30

12-30.png

「『讓值班工程師在半夜手動重啟服務』不只浪費人力,也沒有什麼實際意義。」——《SRE工作現場直擊!:維運起點x實戰經驗x職涯規劃面面觀》

你也曾經被安排要在凌晨三點值班,那個幾乎所有使用者都在休息的時間,去手動執行任何的維運工作嗎?

你覺得那時候的工作效率、精神力、專注力充足嗎?

有沒有因為精神不濟,不小心差點刪庫要跑路呢?

如果再給你一次機會,你覺得有什麼方法可以讓你們不需要值班?或者減少值班時還要手動執行任務呢?

試著建立一個制度、流程及防呆機制,讓複雜的任務可以簡單化,避免將工程師放入一個處處暗藏危機,不小心就會引爆炸彈的情境。

畢竟半夜三四點還要照著 SOP 輸入指令,你就不擔心他一個眼花,不小心多輸入了個 * / 之類的嗎?

同時,也可以試著去了解,該任務在手動與自動化執行之間的差距為何?如果無法改善此項任務的執行方式,是否意味著團隊對於對應的服務、系統、軟體運作的理解還不夠充分呢?