指標
指標是對資源性能的數據描述或狀態描述,指標由命名空間、維度、指標名稱和單位組成。
其中,命名空間特指指標的命名空間,可將其理解為存放指標的容器,不同命名空間中的指標彼此獨立,因此來自不同應用程序的指標不會被錯誤地聚合到相同的統計信息中。維度是指標的分類,每個指標都包含用于描述該指標的特定特征,可以將維度理解為這些特征的類別。下圖以集群指標為例,介紹了命名空間、維度和指標的關系。

主機
AOM的每一臺主機對應一臺虛擬機或物理機。主機可以是您自己的虛擬機或物理機,也可以是您通過天翼云購買的虛擬機或物理機,只要主機的操作系統滿足AOM支持的操作系統(AOM支持的操作系統詳見操作系統使用限制)且主機已安裝ICAgent,即可將主機接入到AOM中進行監控。
ICAgent
ICAgent是AOM的采集器,運行在每臺主機上用于實時采集指標、日志和應用性能數據。安裝ICAgent是使用AOM的前提,否則將無法正常使用AOM。
告警
告警是指AOM自身或ECS、ServiceStage、CCE等外部服務在異常情況或在可能導致異常情況下上報的信息,告警會引起業務異常,您需要對告警進行處理。
告警清除方式包括自動清除和手動清除兩種。
- 自動清除:產生告警的故障消除后,AOM會自動清除告警,您不需要做任何操作,例如:閾值告警。
- 手動清除:產生告警的故障消除后,AOM不會自動清除告警,您需要手動清除告警,例如:ICAgent安裝失敗告警。
事件
事件告訴您AOM自身或ECS、ServiceStage、CCE等外部服務發生了某種變化,但不一定會引起業務異常,事件一般用來表達一些重要信息。您不用對事件進行處理。
閾值規則
閾值規則指對資源的監控指標設置閾值條件,當指標數據滿足閾值條件時,會產生閾值告警(閾值告警即由閾值規則觸發而產生的告警);當沒有指標數據上報時,會產生數據不足事件(數據不足事件即由閾值規則觸發而產生的事件)。
日志
AOM提供了海量運行日志的檢索和分析功能,支持日志采集、下載、轉儲、搜索,并提供報表分析、SQL查詢、實時監控、關鍵詞告警等能力。
統計規則
周期性地統計關鍵詞或SQL語句,并生成指標數據,以便您實時了解系統性能及業務等信息。同時,還可以針對日志指標添加閾值規則,當滿足閾值條件時產生閾值告警,以便您能在第一時間發現異常并進行處理。