資源總覽
更新時間 2025-07-14 10:00:34
最近更新時間: 2025-07-14 10:00:34
分享文章
面向在一站式智算服務平臺已開通專屬集群的用戶,旨在讓管理員能夠輕松查看并管理專屬集群的資源使用情況
前置條件
已開通專屬集群
賬號為主賬號或者角色為IAM管理員的子賬號
操作步驟
進入資源總覽模塊,資源總覽詳情頁分為資源&任務大盤、資源利用曲線圖、任務列表三大板塊。
定位到資源&任務大盤,選擇集群,設置時間范圍,即可查看選定集群所選時間段內GPU/CPU總量、正在使用量、空閑量以及正在使用量/空閑量占比。可以查看當前訓練中任務數、排隊中任務數以及排隊中任務所需GPU卡數。
定位到資源利用曲線圖,設置時間范圍,即可查看所選時間段內,GPU/CPU/顯存/內存利用率曲線圖,支持按每天、每小時查看,支持將數據下載到本地。可以查看GPU/CPU卡時耗時曲線圖,啟動訓練任務數/實例數曲線圖,排隊中任務所需GPU/CPU峰值數曲線圖。
定位到任務列表,設有排隊任務管理、運行任務管理、運行歷史三個標簽頁,排隊任務可以查看等待時長,可以調整其優先級,優先級越高越優先被調度。運行任務可以查看任務的運行狀態及時長,運行歷史可以查看運行結束的任務。