調用監控
更新時間 2025-09-17 18:06:43
最近更新時間: 2025-09-17 18:06:43
分享文章
調用監控支持查看在線推理預置服務、我的服務在指定時間段內的調用數據和監控指標詳情,包括調用總量、調用失敗量、調用總tokens等指標,并支持按日、按時、按分鐘粒度展示數據,幫助了解服務的使用情況和性能變化。
前提條件
預置服務和我的服務產生調用記錄后才可查看調用監控數據。
賬號權限說明
主賬號可查看其名下所有子賬號分別的調用監控數據。
查看服務調用的監控數據
登錄模型推理服務。
在左側導航欄選擇“調用監控”。
選擇目標預置服務,點擊“查看監控”,進入該模型的調用數據詳情頁,可以查看具體的模型在特定服務組、特定服務中的調用監控情況。
點擊“調用失敗明細”,可以查看調用失敗的次數、占比、錯誤信息等數據。
點擊“導出”,可以直接導出調用總覽或調用失敗明細數據到本地。
調用統計篩選項說明
| 篩選項 | 說明 |
|---|---|
| 服務組創建人 | 篩選子賬號。 僅名下存在子賬號的主賬號可見。 |
| 服務名稱 | 支持選擇在線推理的預置服務和我的服務。 |
| 服務組 | 選擇查看全部服務組或具體的服務組名稱。 |
| 時間精度 | 支持選擇按日、按時、按分鐘。 |
| 時間范圍 | 自定義選擇時間范圍。 當時間精度選擇按日時,范圍最大支持31天;當時間精度選擇按時時,范圍最大支持7天;當時間精度選擇按分鐘時,范圍最大支持1天。 |
調用總覽的參數說明
| 參數 | 說明 |
|---|---|
| 調用次數 | 服務調用的次數。 |
| 調用失敗率(%) | 調用失敗次數/調用總次數。 |
| 調用Token量(萬tokens) | 服務調用的tokens數。 文本生圖類模型服務調用無此項統計值。 |
| 平均響應時延(ms) | 單位時間內成功請求的響應時間平均值。 |
| 首Token時延(ms) | 僅統計流式響應。 從接收請求到生成第一個輸出token所需的時間。 文本生圖類模型服務調用無此項統計值。 |
| 非首Token時延(ms) | 僅統計流式響應。 生成后續每個輸出token所需的時間間隔,不包括首token。 文本生圖類模型服務調用無此項統計值。 |
| 整句Token時延(ms) | 請求從開始到返回到最后一個token的耗時,統計流式及非流式響應。 文本生圖類模型服務調用無此項統計值。 |
| QPS | Query Per Second,即每秒響應請求數。 |
調用失敗明細的參數說明
| 參數 | 說明 |
|---|---|
| 錯誤碼 | 報錯的錯誤碼。 |
| 錯誤次數 | 錯誤發生的次數。 |
| 錯誤占比 | 該錯誤碼發生次數占全部錯誤次數的比例。 |
| 錯誤描述 | 錯誤的描述信息。 |