2025/12/18

12-18.png

「真正的觀測,是一種思維訓練——從現象找到原因、從原因推導行動、從行動形成改善的循環。」——《Grafana zero to hero:從視覺化到智慧監控,打造全知視角的可觀測性平台》

過往在搭建完系統服務之後,我們多半都會為其設置各種告警與監控指標,並且拉了一個漂亮的 dashboard。做完這些,然後呢?就沒有然後了,因為通常你下一次會更動它的時間,即是下次系統炸鍋之後了。

觀察、推論、行動,然後周而復始,又或者好比 PDCA,其實它們並不是什麼新鮮的觀念,許多人都知道,但要能持續的落實,卻是一件難事。

而其中的關鍵之一當然是那份「主動性」。你是否帶有目標及目的去主動收集資訊,並根據收集到的資訊進行推論、思考與評估,然後依據推論去制定改善行動,並且確實的執行它。

你有在主動的收集各種資訊嗎?收集客戶對於產品的 Feedback?收集 Application 與 Infra 的各種 Logs、Mertics?收集 DORA Mertics?收集重要的商業指標?

DevOps 提倡持續改善,然而要改善什麼?以什麼作為改善之依據?這些都仰賴於你是否有主動觀測,以及你都觀測了些什麼?