2026/02/07

2026-02-07.png

「Design for Operation 不是口號,是平常就在做了。」——《SRE實踐與開發平台指南》

隨著時代變遷,現在的軟體背後多半都與雲端、APP、線上服務脫離不了關係,甚至軟體供應商所提供的「軟體」就是一項雲端服務,使用者只要能連上網就能使用。

面對此種類型的軟體,軟體團隊除了需要關注功能性需求,非功能性需求也是重要的必備條件,像是軟體的「可維護性」或軟體是否容易維運,都會是團隊需要關注的議題。

我們都看過與聽過各大廠出包炸鍋的事件,每當看見這些事件,都不禁想為該公司背後那群正在燃燒生命搶修的工程師們捏一把冷汗。

每一次發生問題,我們除了在一旁看見維運或 SRE 團隊陷入巨大的壓力之外,我們是否還能在事前做些什麼來減輕這些負擔呢?

我們可不可以比照其他 Shift left 的實踐,在更早的設計規劃階段就思考軟體維運的議題?

或是如同《SRE》書中提倡的,讓 SRE 保留 50% 的時間,讓他們有餘裕去處理救火以外,那些有助於 SRE 團隊得以更高效、有品質的來維運服務的那些任務?

如同金句說的 Design for Operation 不該只是口號,你的團隊是否確實有在每天的日常中持續改善,一步一步向著更好的未來前進呢?