告警規則詳情
操作場景
查看告警規則配置信息,新增、修改、刪除告警規則。
操作步驟
-
登錄翼MR管理控制臺。
-
單擊“我的集群”,單擊指定的集群名稱,進入集群信息頁面。
-
單擊“翼MR Manager”tab,單擊“前往翼MR Manager”。
-
進入到翼MR Manager以后,單擊菜單“監控與告警 > 告警規則”,點擊需要查看或變更的告警規則文件名,跳轉至告警規則文件詳情,如圖所示:
-
“規則信息”一節展示所有告警規則分組,點擊告警規則分組名,可展開組下告警規則。繼續點擊告警規則名,可展開單條告警規則的具體信息,如圖所示:
-
點擊告警規則組名右側新增按鈕,可新增告警規則,如圖所示:
-
點擊告警規則名右側編輯按鈕,可編輯告警規則信息。點擊告警規則名右側刪除按鈕,可刪除告警規則。
-
對告警規則的編輯操作,需要點擊右上角“同步”按鈕,將告警配置同步到Prometheus實例并加載生效,如圖所示:
說明
告警規則各字段說明如下:
規則類型:分為告警、記錄兩種類型。告警類型用于配置異常告警,當監控指標觸發告警表達式時,觸發告警。記錄類型用于預聚合監控指標,依照表達式聚合計算。
持續時間:僅“告警”類型具有,當表達式成立且持續超過所設時間,告警將會觸發。如果希望表達式成立后立即觸發告警,可設置為0。需注意,持續時間設置過小,可能導致頻繁無意義報警。
表達式:填寫PromQL語法的表達式。
標簽:預設字段mozi_alert_level,用于定義告警級別,四個告警級別為WARNING(警告)、ERROR(錯誤)、SEVERITY(嚴重)、DISASTER(災難)。例如,配置標簽mozi_alert_level為SEVERITY,觸發告警后,在“告警歷史”頁面,告警的級別為“嚴重”。
標注:預設標注字段description,用于定義告警信息,觸發告警后,在“告警歷史”頁面,description字段對應的信息,將顯示為“告警信息”。
預設的記錄類型告警規則,與系統功能相關,不建議用戶自行修改。
?對告警規則組、告警規則的所有新增、修改、刪除操作,都需要通過“同步”按鈕,同步到監控組件并生效。
可以勾選一批告警規則文件導出為壓縮文件,壓縮文件可再次用于告警規則導入,導入操作會直接同步到監控組件并生效,不需要額外的同步操作。需要注意,導入過程,同名告警規則文件會被覆蓋。
可以勾選一批告警規則文件進行刪除,刪除操作會直接同步到監控組件并生效,不需要額外的同步操作。