觀察雲是面向開發、運維、測試、業務團隊的實時資料監控平台,可以統一滿足雲、雲原生、應用、業務的監控需求,快速實現基礎設施、中介軟體、應用層、業務層的可觀測性。 基礎設施監控、日誌指標管理、應用效能監控、使用者訪問監控、可用性監控、異常檢測、系統級安全檢查、CI視覺化、場景和看板是“觀察雲”的可觀測解決方案,通過統一的資料採集、全面的資料監控、無縫關聯分析、自定義等功能,為使用者提供更快捷、更輕鬆、更全面、更自由的系統可觀測平台場景搭建高度可程式設計,成員協作敏捷。“cat” 是服務端專案的基礎元件,它提供了 j**a、c c++、nodeJS、Python、Go等多語言客戶端與美團點評的基礎設施中介軟體框架(MVC框架、RPC框架、資料庫框架、快取框架、訊息佇列、配置系統等)深度融合,為美團點評各業務線提供豐富的效能指標、健康狀態、實時告警等。
新增不超過 140 字的評論(可選)。
新增乙個 ** 注釋,可選效果不超過 140 個字。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增不超過 140 字的評論(可選)。
新增**評論,不超過140字(可選) 目前的方案存在以下問題 1:雖然可以實現純後端的鏈路指標監控,但缺乏鏈路追蹤,缺乏鏈路拓撲,無法做到與基礎設施、前端的全鏈路和日誌 2: 研發端:通過人工埋設收集關鍵指標,增加研發和維護成本, CAT監控系統與業務**相互依存,導致一方出現問題,可能影響業務3: 運維端:CAT系統需要維護、公升級、維護等,無法獲取有效資訊(CPU、 MEM等)在運維端通過CAT系統。中介軟體串聯,資料分析難度大 4:使用者體驗一般,社群一般,關於CAT本身,它是乙個開源專案,目前開源專案在生態中的更新頻率如下圖所示,開源專案缺乏維護,不適合長期穩定發展。
新增**評論,不超過140字(可選) 5:因為是研發回顧所有 CAT 本身都嚴重依賴 m**en 6:程式嚴重依賴太多包,整個程式本身比較重 根據對接同學的反饋,當前租戶資訊是以通過**植入的cat***(如事務、事件、心跳等)為基礎,然後顯示在CAT系統的指標維度中, 鏈路拓撲圖缺失,研發生反饋解決多租戶問題,以上推薦解決方案如下: 1:在伺服器上安裝datakit,收集CPU、記憶體、網路等資訊 2:訪問rum到前端**、APP、小程式 目的:預設自帶隱藏資訊, 並且觀測雲預設不收集敏感使用者資訊(手機號、使用者ID),如果需要收集可以使用前端觀察雲提供的 SDK API 對埋點進行個性化設定3:後端服務,當應用啟動時,啟動乙個 j**aagentJAR,自動收集鏈結資訊 目的:通過行為和日誌與前端對接,打造全鏈路環境。 效果是 xx 使用者可以點選【登入】按鈕檢視呼叫的後端 API 的詳細鏈結資訊,同時可以看到日誌資訊 4:資料庫、介質和間接訪問 目的:在觀測雲場景中搭建資料庫和中介軟體場景,將檢視繫結到整個鏈結, 並意識到在檢視某個請求時,可以同時檢視資料庫和中介軟體操作**情況五:雲廠商資料採集 目的:實時掌握雲產品的使用情況,及時報警如:證書過期提醒等。 CAT 基於 j** a 開發的實時應用監控平台為後端服務提供全面的實時監控和告警服務,客戶減少故障發現時間,降低故障定位成本,並輔助鏈路服務本身,但與觀測雲相比,觀測雲提供了一整套可觀測的解決方案, 從龐大而複雜的伺服器主機中,梳理出清晰的雲原生關係,精準定位每個請求,記錄完整的事件和日誌,擁有豐富的可編輯場景圖,充分了解和記錄每個租戶的使用者行為軌跡,是乙個完整的可觀測平台。