預置模型
是指平臺提供的原始模型,您可以通過選擇預置模型進行訓練從而得到行業或細分場景模型,不同的基礎模型的參數和能力不同,我們將持續推出不同能力方向的模型。
模型微調
是指利用預先訓練好的神經網絡模型,并針對特定任務在相對較少量的監督數據上進行重新訓練的技術。這種方法能夠充分利用預訓練模型在大型數據集上學到的通用特征和知識,從而加速在新任務上的訓練過程,并通常能夠取得較好的性能表現。
函數調用Function Calling
Function Calling 是一種將大模型與外部工具和 API 相連的關鍵功能,作為自然語言與信息接口之間的“翻譯官”,它能夠將用戶的自然語言請求智能地轉化為對特定工具或 API 的調用,從而高效滿足用戶的特定需求。
Token
在自然語言處理中,token 通常指的是將文本分割成的最小單位,比如詞語、子詞或字符。在調用模型推理服務時,會將輸入內容進行分詞(tokenize),轉化為模型可以理解的 token ,經過模型處理后,同樣輸出 token,并轉化為您需要的文本或者其他內容載體。而模型處理(包括輸入、輸出)的 token 數量會被作為模型推理服務用量的一個重要計量單位。由于不同模型采用的分詞策略不同,同一段文本可能會被轉化為不同數量的 token。
迭代輪次
是指模型訓練過程中模型學習數據集的次數,可理解為學習幾遍數據,可依據需求進行調整。
批處理大小
是指在模型訓練過程中,每次處理的數據樣本的數量,可理解為模型每看多少數據即更新一次模型參數,在選擇批處理大小時需要綜合考慮各種因素。
學習率
是指更新模型參數的系數,它決定了在每次迭代中,模型參數應該沿著梯度下降的方向更新多少,需要根據具體情況來仔細選擇和調整學習率。
訓練數據集
是機器學習或深度學習模型訓練過程中的重要組成部分。訓練數據集是一組已知輸入和對應輸出的數據,用于訓練模型以學習從輸入到輸出的映射關系。構建合適訓練集,通過模型調優可增強模型能力,提升預測效果。
測試數據集
在機器學習和深度學習中扮演著至關重要的角色,它用于評估模型在未見過的數據上的性能。與訓練數據集不同,測試數據集在模型訓練過程中是不可見的,也就是說,模型在接觸到測試數據之前已經完成了所有的訓練和調整。