2023.6.22|文章來源:Riverbed Blog|原文連結
Riverbed|可觀測性的三大支柱是什麼?
辦公室監控的演變是如何發展的?
可觀測性中常見的三大支柱為日誌記錄、指標和追蹤,將這三種數據類型相結合,可以顯著提高 IT 架構中應用監控和管理能力。因為不同類型的數據,可以協助 IT 工程師更好地理解和優化系統的效能和行為,在問題發生時快速地發現、診斷、解決問題。
一起探討與了解三大支柱,分析 Riverbed 如何進一步整合所有 IT 的數據、洞察和行動。
- 什麼是日誌記錄?
- 什麼是指標?
- 什麼是追蹤?
可觀測性的三大支柱提供對系統的全面視角,使工程師能夠監控、調適和優化系統。他們構成了可觀測性的基礎,使工程師能夠深入了解複雜系統並提高其可靠性、可擴展性和可維護性。
可觀測性有什麼好處?
- 應用程式效能監控:全面的端到端可觀測性幫助企業更快地識別效能問題,甚至能夠捕捉由於採用雲原生和複雜的現代化 IT架構而引起的問題。借助先進的可觀測性解決方案,可以自動化更多的任務,提高維運和開發團隊的生產力和創造力。
- DevOps / SecOps 和 SRE:可觀測性應該是應用程式及其底層基礎設施的基本特徵,而非單純使用新工具的結果。軟體設計團隊和開發團隊需確保其所開發的程式易於觀測。在軟體交付的整個生命週期中,DevOps / SecOps 和 SRE 團隊能夠利用和理解可觀測資料,以創建更強大、更安全、更具彈性的應用程式。
- 基礎設施、雲和 Kubernetes 的監控:可觀測性的一個好處是它有助於基礎設施監控。基礎設施和維運團隊可以利用可觀測性解決方案提供更好的異常事件上下文資訊,從而更快地識別和解決問題,優化資源利用率,並提高對基礎設施和應用程式的管理能力。
- 終端使用者體驗:良好的用戶體驗可以提升企業的聲譽和收入,為其帶來競爭優勢。通過可觀測性解決方案,企業能夠在終端使用者察覺問題之前發現並解決這些問題,並在用戶提出之前實施改進措施,從而提高客戶滿意度和留存率。
實現可觀測性將會面臨哪些挑戰?
實現可觀測性一直以來都是具有挑戰性的難題,隨著雲服務的複雜性日益增加並且企業加速採用雲服務的趨勢下,解決這難題變得相當重要,特別是在複雜的現代化 IT 和容器化應用的環境下,雲服務所產生的監控資料變得更加廣泛與複雜。和過去相比,他們不僅數量更多,種類和規模也更大,遠超出傳統監控系統所能提供的資料範疇。
實現可觀測性,通常會面臨以下困難:
- 數據孤島 (Data Silos):因為不同的採集代理程式、資料來源和監控工具無法很好地整合或協同工作,應用程式、各種雲服務和數位通道 (Web、行動網路、物聯網) 之間的依賴關係難以理解。
- 大規模、高速度、多樣性和複雜性挑戰:在使用 AWS、Azure 和 GCP ( Google Cloud Platform ) 等現代雲服務基礎設施架構中,各服務和元件產生的原始指標資料量非常龐大,選擇以往的監控方案,幾乎不可能找到答案(難以有效處理和分析,從中獲取有用的資訊)。使用 Kubernetes 和容器進行快速擴縮容的能力,導致了更頻繁的資料生成和變動,增加了對資料管理和分析的挑戰。
- 缺乏預生產環境:儘管可以進行高負載的模擬測試,但開發人員依舊缺少準確觀測或理解實際情況的方法,在程式碼發佈前無法在生產環境中運行,瞭解到使用者的操作(真實行為、網路延遲、不同地理位置的訪問等因素),如何影響應用程式和基礎設施。
- 因排查故障耗費大量時間:為了解決問題並試圖確定問題源頭,實施團隊、維運團隊、基礎設施團隊、開發團隊和數位體驗團隊(DX)(客戶與企業所有數位管道互動的方式,是客戶體驗的重要組成部分)都被納入故障排除工作。但最終結果是,寶貴的時間被浪費在猜測和理解指標資料上。

Riverbed Alluvio 統一 IT 領域的數據、洞察和行動。
簡而言之,Riverbed 在可觀測性的三大支柱基礎上更進一步,提供為 IT 數據、洞察和行動的統一解決方案。
- 統一的數據 是對各種來源(包括設備、網路、應用程式、雲原生環境、使用者和第三方解決方案)的全保真遙測的支持。與其他解決方案不同,針對現今的分散式環境規模進行抽樣處理,Riverbed 擷取每筆交易、封包和流量,以及每種類型應用程式的實際使用者體驗。全保真數據使 IT 部門能夠理解正在發生的情況和已經發生的情況,不會因採樣而遺漏關鍵事件,從而提供統一可觀測性的基礎。
- 統一的洞察 意味著 IT 部門可以快速解決正確的問題,確保使用者的工作效率。憑藉最佳數據、人工智能和多方面關聯性以及工作流程自動化,Alluvio IQ 提供豐富的上下文、經過篩選和優先排序的洞察,協助 IT 團隊理解問題的範圍、嚴重程度及效能不佳的原因。

Alluvio IQ 將與事件相關的所有證據整合在一份報告中,也可用於填寫故障工單。
- 統一的行動 藉 runbooks 複製和自動化 IT 專家的最佳實踐,以提供安全事件效能的可能根本原因。透過自動化從不同的解決方案收集支援性診斷數據,Alluvio IQ 協助 IT 團隊加速解決問題、打破資料孤島,避免耗時的討論。

Alluvio IQ runbooks 自動化收集診斷數據的過程,以加快解決問題的速度。
為什麼選擇 Alluvio IQ 統一可觀測性?
Alluvio IQ 統一可觀測性整合統一數據、洞察和行動,賦予所有 IT 團隊無縫的數位體驗和端到端效能可見性,結合企業範圍的數據收集、複雜的人工智能技術和智能自動化,以加速常見和重複性的 IT 任務。
因此,IT 團隊可以實現以下優勢:
- 即時問題檢測:透過統一可觀測性,在使用者投訴或故障發生前,主動檢測到問題的根本原因。Alluvio IQ 統一可觀測性使用智能自動化來收集支援證據和上下文,有助於減少解決問題並使系統恢復正常運行所需的時間。
- 更好的效能:透過監控關鍵指標,統一的可觀測性有助於識別不太理想的效能區域。可以提高網路、應用程式和使用者的效能,並且預防潛在問題的發生。
- 改善協同工作:統一可觀測性工具可為企業內不同部門提供 IT 環境的可見性,改善團隊之間的協作,協助實現提高效能和可靠性的共同目標。
- 良好客戶體驗: Alluvio IQ 有助於改善客戶的數位體驗,提升滿意度和忠誠度。
擴展可觀測性的三大支柱延伸到統一的數據、洞察和行動。
Copyright © 2024 PetaCom Technology Co. LTD, All Rights Reserved