告警解釋
系統按60秒周期性檢測Hue服務狀態。當Hue服務不可用時產生該告警。
當Hue服務恢復時,告警恢復。
告警屬性
| 告警ID | 告警級別 | 是否自動清除 |
|---|---|---|
| 20002 | 緊急 | 是 |
告警參數
| 參數名稱 | 參數含義 |
|---|---|
| 來源 | 產生告警的集群名稱。 |
| 服務名 | 產生告警的服務名稱。 |
| 角色名 | 產生告警的角色名稱。 |
| 主機名 | 產生告警的主機名。 |
對系統的影響
系統無法提供數據加載,查詢,提取服務。
可能原因
Hue服務所依賴內部服務KrbServer故障。
Hue服務所依賴內部服務DBService故障。
與DBService連接的網絡異常。
處理步驟
檢查KrbServer服務是否正常
1.在FusionInsight Manager界面,選擇“集群 > 待操作集群的名稱 > 服務”,在服務列表中查看“KrbServer”的“運行狀態”是否為“良好”。
- 是,執行步驟4。
- 否,執行步驟2。
2.手動重啟KrbServer服務。
3.等待幾分鐘。檢查“Hue服務不可用”告警是否恢復。
- 是,處理完畢。
- 否,執行步驟4。
檢查DBService是否正常
4.登錄FusionInsight Manager界面,選擇“集群 > 待操作集群的名稱 > 服務”。
5.在服務列表中查看DBService服務運行狀態是否為“良好”。
- 是,執行步驟8。
- 否,執行步驟6。
6.重啟DBService服務。

說明重啟服務需要輸入FusionInsight Manager管理員密碼。
7.等待幾分鐘。檢查“Hue服務不可用”告警是否恢復。
- 是,操作結束。
- 否,執行步驟8。
檢查與DBService連接的網絡是否正常
8.在FusionInsight Manager界面,選擇“集群 > 待操作集群的名稱 > 服務 > Hue > 實例”,記錄主Hue的IP地址。
9.登錄主Hue的IP地址。
10.執行ping命令,查看主Hue所在主機與DBService服務所在主機的網絡連接是否正常。(獲取DBService服務IP地址的方式和獲取主Hue IP地址的方式相同。)
- 是,執行步驟13。
- 否,執行步驟11。
11.聯系網絡管理員恢復網絡。
12.等待幾分鐘。檢查“Hue服務不可用”告警是否恢復。
- 是,處理完畢。
- 否,執行步驟13。
收集故障信息
13.在FusionInsight Manager界面,選擇“運維 > 日志 > 下載”。
14.在“服務”框中勾選如下節點信息。
- Hue
- Controller
15.單擊右上角的
設置日志收集的“開始時間”和“結束時間”分別為告警產生時間的前后10分鐘,單擊“下載”。
16.在FusionInsight Manager界面,選擇“集群 > 待操作集群的名稱 > 服務 > Hue”。
17.選擇“更多 > 重啟服務”,單擊“確定”。
18.檢查該告警是否恢復。
- 是,處理完畢。
- 否,執行步驟19。
19.請聯系運維人員,并發送已收集的故障日志信息。
告警清除
此告警修復后,系統會自動清除此告警,無需手工清除。
參考信息
無。