健康檢查概述
更新時間 2025-04-01 16:25:20
最近更新時間: 2025-04-01 16:25:20
分享文章
本章節主要介紹健康檢查操作和功能,主要是從集群健康檢查維度進行介紹。
健康檢查
操作場景
該任務指導用戶在日常運維中完成集群進行健康檢查的工作,以保證集群各項參數、配置以及監控沒有異常、能夠長時間穩定運行。
操作說明
集群健康檢查的范圍包含Manager服務級別的各個組件檢查:服務級別關注組件是否能夠提供正常的服務、告警情況以及各個組件差異化的檢查指標。
操作步驟
集群健康檢查
- 手動執行所有服務的健康檢查。
- 在集群服務頁,單擊集群服務列表上方的“更多操作 > 健康檢查”。
- 周期執行所有服務的健康檢查。
- 在集群服務>健康檢查報告>點擊列表左上方間隔設置按鈕>跳出周期任務設置彈框,支持用戶根據天/周/月維度進行間隔配置,支持配置具體時刻,創建成功后,對支持的組件服務會定期發起健康檢查。
說明
點擊健康檢查之后頁面跳轉至健康檢查報告Tab頁面,展示集群的健康檢查列表,列表置頂為最新發起的健康檢查,點開一級列表下方展示各個組件的檢查詳情。
點擊一級列表操作中的導出報告,則支持導出CSV文件,用戶可本地查閱健康報告。
查看并導出檢查報告
操作場景
為了滿足對健康檢查結果的進一步具體分析,您可以在翼MR中查看以及導出健康檢查的結果。
操作說明
平臺健康檢查的范圍包含Manager服務級別的健康檢查。
集群健康檢查可以包含三方面檢查項:各檢查對象的服務狀態、告警信息、以及每個組件差異化的相關指標。
前提條件
已執行健康檢查。
操作步驟
-
在集群服務頁,點擊健康檢查報告Tab頁面。
-
在健康檢查的報告面板上單擊“導出報告”導出健康檢查報告,下載后可本地查看檢查項的完整信息,集群與主機健康檢查報告導出格式均為CSV。