【 文章來源 】https://www.techtarget.com/searchitoperations/tip/Common-use-cases-for-observability
這些可觀測性用例使組織能夠更深入地挖掘其系統監控和分析,以提前發現潛在問題并提醒 IT 員工。
可觀測性的常見用例
圍繞技術平臺的可觀測性背后的想法是通過其輸出來了解復雜環境的狀態。然后,可觀測性的深度導致該平臺上的任何問題可以如何快速有效地被識別和修復。
這看起來像是重述和重命名 IT 管理員一直在做的事情——試圖通過使用系統管理軟件和其他工具來掌握正在發生的事情。
然而,可觀測性并不是簡單地重新利用現有軟件來從客戶那里獲得更多的錢。這是大多數組織正在努力應對的變化所驅動的真正需求——從完全擁有和控制的平臺轉變為擁有和共享、物理和虛擬化的基于云的平臺的復雜混合環境。涵蓋這種環境的工具很少而且相差甚遠,但可觀測性提供了處理其中許多領域的起點。
用例 1. 底層可觀測性架構
可觀測性匯集了來自廣泛來源的數據,因此可以對其進行分析并確定問題所在或將來可能出現的問題。這需要強大的監控能力,以及對被監控系統每個部分的基礎指標的理解。必須了解平臺不同部分之間的依賴關系,并且必須定義正常和異常。這可以作為可觀測性系統運行時的開箱即用設置、用戶定義設置和經驗學習限制的組合來完成。
此外,可觀測性應該能夠識別來自零日威脅的異常活動或由糟糕或錯誤的編碼引起的直接問題。
用例 2. 數據監控、匯總和報告
公共云所有者可能不允許組織運行深入的管理軟件,但他們的平臺會不斷創建數據,例如遙測和日志數據,尤其是與工作負載相關的數據。通過將這些數據與數據流聚合、分析并獲得近乎實時的報告,組織可以及早發現問題。如果問題出在平臺上,您可以立即處理;如果它被指示為在平臺的第三方擁有的部分上,則您可以及早了解該問題,并可以與提供商共享數據,以便它可以解決問題。
基于事件的自動化使 IT 團隊,尤其是站點可靠性工程團隊,能夠觸發故障單,這些故障單可以路由到正確的應用服務或人員。這使員工能夠繼續為組織創造戰略 IT 價值的業務。
例如,員工可以專注于數字化轉型等領域,并更加相信通過深度可觀測性進行的自動修復將使復雜的工作流程更有可能發揮作用,并且在出現問題時更快地得到修復。
用例 3. 平臺安全和 DevOps
可觀測性派上用場的另一個領域是主動管理安全性。來自整個平臺的數據輸出可以監控異常活動并觸發事件,以減輕或阻止安全問題的任何影響。
DevOps 環境可以監控異常活動,如果該操作會在工作平臺上產生問題,則可以防止配置工作負載。即使工作負載在主平臺上并開始出現異常行為,可觀測性也可用于啟動限制工作負載或使工作負載脫機的操作,并在必要時將其替換為已知的工作版本。
即使是 DevOps 的上游,開發人員也會發現可觀測性很有用:處理不同微服務和虛擬容器的輸出的能力可確保這些環境在 DevOps 線下推時為生產環境做好準備。
用例 4. 長期趨勢
可觀測性的一個有用方面是隨著時間的推移跟蹤應用程序或平臺的性能。可以發現變化,并且可以識別目標之外的趨勢,從而觸發補救措施或請求人工干預。
例如,遭受內存泄漏的應用程序或服務可能會導致問題,即使泄漏速度很慢。可以識別更多人使用的應用程序并調整資源以更好地滿足他們的需求。
目前,可觀測性還不能作為單一的現成產品提供。但是,通過確保監控、數據聚合和分析能力到位以支持可觀測性方法,然后將事件觸發器集成到幫助臺系統中,自動化系統管理和基于云的資源管理和工作負載供應引擎應該為組織提供大部分他們對未來的要求。
觀測云——快速實現系統可觀測
觀測云(www.guance.com),新一代云原生全鏈路數據可觀測平臺,國內首批獲得中國信通院頒發的「可觀測性平臺技術能力」最高級別「先進級」認證,實現統一采集、統一標簽、統一存儲和統一界面,帶來全功能的一體化可觀測體驗。
觀測云能全環境高基數采集數據,支持多維度信息智能檢索分析,及提供強大的自定義可編程能力,使系統運行狀態盡在掌控,故障根因無所遁形。