調度中心
更新時間 2025-07-14 10:00:36
最近更新時間: 2025-07-14 10:00:36
分享文章
面向在一站式智算服務平臺已開通專屬集群的租戶,旨在讓管理員能夠輕松查看并調度集群資源
前置條件
已開通專屬集群
賬號為主賬號或者角色為IAM管理員的子賬號
調度中心說明
進入調度中心模塊,調度中心詳情頁分為節點統計大盤、節點狀態監控、節點列表三大板塊。
定位到節點統計大盤,選擇集群,即可查看選定集群節點維度的資源情況,包含總節點數、空閑節點數、污點節點數、異常GPU卡數、單節點最大空閑GPU卡數、正在使用/空閑GPU卡數。
定位到節點狀態監控,可以通過不同顏色區分每個節點每塊GPU卡的占用/空閑狀態,以及是否出現硬件錯誤。
定位到節點列表,可以查看所有節點的狀態、標簽、資源規格、GPU/CPU/內存利用率等信息。將標簽頁從節點列表切換到GPU列表,可以查看所有GPU卡運行的實例、運行時長、GPU/顯存利用率等信息。