AOM有哪些使用限制?
操作系統使用限制
AOM支持多個操作系統,在創建主機時您需選擇AOM支持的操作系統,詳見下表,否則無法使用AOM對主機進行監控。
AOM支持的操作系統及版本
操作系統 版本 SUSE SUSE Enterprise 11 SP4 64bit SUSE Enterprise 12 SP1 64bit SUSE Enterprise 12 SP2 64bit SUSE Enterprise 12 SP3 64bit OpenSUSE 13.2 64bit 42.2 64bit 15.0 64bit(該版本暫不支持syslog日志采集) CentOS 6.3 64bit 6.5 64bit 6.8 64bit 6.9 64bit 6.10 64bit 7.1 64bit 7.2 64bit 7.3 64bit 7.4 64bit 7.5 64bit 7.6 64bit Ubuntu 14.04 server 64bit 16.04 server 64bit 18.04 server 64bit Fedora 24 64bit 25 64bit 29 64bit Debian 7.5.0 32bit 7.5.0 64bit 8.2.0 64bit 8.8.0 64bit 9.0.0 64bit
說明
對于Linux x86_64服務器,AOM支持上表中所有的操作系統及版本。
對于Linux ARM服務器,CentOS操作系統僅支持7.4 及其以上版本,上表所列的其他操作系統對應版本均支持。
資源使用限制
在使用AOM時,您需注意以下使用限制,詳見下表。
資源使用限制
分類 對象 使用限制 儀表盤 儀表盤 1個區域中最多可創建50個儀表盤。
1個資源集中最多可創建150個儀表盤。儀表盤中的圖表 1個儀表盤中最多可添加20個圖表。
1個儀表盤中最多可添加30個圖表。儀表盤中圖表可選資源、閾值規則、組件或主機的個數
1個曲線圖中最多可添加100個資源,且資源可跨集群選擇。
1個曲線圖中最多可添加12個資源,且資源可跨集群選擇。
1個數字圖只能添加1個資源。
1個閾值狀態圖表最多可添加10個閾值規則。
1個主機狀態圖表最多可添加10個主機。
1個組件狀態圖表最多可添加10個組件。
指標 指標數據 指標數據在數據庫中最多保存30天。 指標總量 單租戶總指標量不超過40W
小規格總指標量不超過10W指標項 資源(例如,集群、組件、主機等)被刪除后,其關聯的指標項在數據庫中最多保存30天。 維度 每個指標的維度最多為20個。
每個指標的維度最多為30個。指標查詢接口 單次最大可同時查詢20個指標。 統計周期 最大統計周期為1小時。 單次查詢返回指標數據 單個指標單次查詢最大返回1440個數據點。 自定義指標 無限制。 上報自定義指標 單次請求數據最大不能超過40KB,上報指標所帶時間戳不能超前于標準UTC時間10分鐘,不接收亂序指標,即有新指標上報后,舊指標上報將會失敗。 應用指標
每個主機的容器個數超過1000個時,ICAgent將停止采集該主機應用指標,并發送“ICAgent停止采集應用指標”告警(告警ID:34105)。
每個主機的容器個數縮減到1000個以內時,ICAgent將恢復該主機應用指標采集,并清除“ICAgent停止采集應用指標”告警。
采集器資源消耗 采集器在采集基礎指標時的資源消耗情況和容器、進程數等因素有關,在未運行任何業務的VM上,采集器將消耗30M內存、1% CPU。為保證采集可靠性,單節點上運行的容器個數應小于1000。 日志 單條日志大小 每條日志最大10KB,超出后ICAgent將不會采集該條日志,即該條日志會被丟棄。 日志流量 每個租戶在每個Region的日志流量不能超過10MB/s。如果超過10MB/s,則可能導致日志丟失。 日志文件 只支持采集文本類型日志文件,不支持采集其他類型日志文件(例如二進制文件)。 每個通過卷掛載日志的路徑下,ICAgent最多采集20個日志文件。 每個ICAgent最多采集1000個容器標準輸出日志文件,容器標準輸出日志只支持json-file類型。 采集日志文件的資源消耗 日志文件采集時消耗的資源和日志量、文件個數及網絡帶寬、backend服務處理能力等多種因素強相關。 日志丟失 采集器使用多種機制保證日志采集的可靠性,盡可能保證數據不丟失,但在如下場景可能導致日志丟失。
日志文件未使用CCE提供的logPolicy輪轉策略。
日志文件輪轉速度過快,如1秒輪轉一次。
系統安全設置或syslog自身原因導致無法轉發日志。
容器運行時間過短,例如小于30s。
單節點總日志產生速度過快,超過了單節點網絡發送帶寬或日志采集速度,建議單節點總日志產生速度<5M/s。
日志丟棄 當單行日志長度超過10240字節時,此行會被丟棄。 日志重復 當采集器被重啟后,重啟時間點附近可能會產生一定的數據重復。 告警 告警 您最多可查詢最近15天的告警。 事件 您最多可查詢最近15天的事件。 - 應用發現規則 應用發現規則最多可創建100個。
服務使用限制
在使用AOM時,當AMS-Access服務出現斷電、或者異常重啟的時候,部分主機、組件、容器等資源會出現一個采集周期的指標數據斷點,該數據斷點對于用戶來講監控頁面上能看到一個斷點,沒有其他影響。如果對斷點有要求,可以在“監控”->“指標瀏覽”頁面中查看指標曲線時,將插值方式設置為0,系統會自動補點,如圖所示
插值方式修改


如何區分告警和事件?
告警和事件的相同點
在AOM中告警和事件都是指AOM自身,或ServiceStage、CCE等外部服務在某種狀態發生變化后上報給AOM的信息。
告警和事件的區別
- 告警是AOM自身,或ServiceStage、CCE等外部服務在異常情況或在可能導致異常情況下上報的信息,并且您需采取相應措施清除故障,否則會由于AOM自身或外部服務的功能異常而引起業務的異常。
- 事件是告訴您AOM自身,或ServiceStage、CCE等外部服務發生了某種變化,但不一定會引起業務異常,事件一般用來表達一些重要信息。您不用對事件進行處理。
時間范圍和統計周期的關系?
AOM約束單個指標單次查詢最大返回1440個數據點,因此統計周期與時間范圍的關系如下所示:
最大可查詢時間范圍=統計周期×1440
當您選中的查詢時間范圍小于等于最大可查詢時間范圍時,所有滿足以上條件的統計周期可以被選擇。例如,查詢1小時的指標時,可選的統計周期為1分鐘和5分鐘。
時間范圍與統計周期的關系如下表所示,監控關系如下表所示。
時間范圍和統計周期關系表
時間范圍 統計周期 近1小時 1分鐘、5分鐘 近6小時 1分鐘、5分鐘、1小時 近1天 近1周 1小時、1天 說明1天只針對日志統計規則生成的指標。
近15天 1小時、1天 說明1天只針對日志統計規則生成的指標。近30天 近3月 近6月 近9月 近12月
AOM展示的日志是否為實時日志?
AOM展示的日志為近實時日志,日志存在秒級時延。
日志從采集上報到處理需要一定的時間,日志量較小時日志會存在10秒左右的時延,日志量特別大時時延會久些。
日志轉儲成功后,容器中的原日志會刪除嗎?
不會刪除。
為什么需要創建連接通道?
不同的VPC之間不能進行通信,您需要在數據訂閱應用所在VPC中創建應用程序并將其配置為終端節點服務,在DMS所在VPC創建終端節點,終端節點和終端節點服務便能建立連接,實現跨VPC資源通信。