主賬號使用流程
前置條件
已使用主賬號登錄到訓推智算服務平臺
主賬號使用流程
主賬號的使用流程,整體如下:
注意:資源配額和工作空間目前僅在杭州7資源池支持
主賬號的使用流程按照AI全周期的工作流程進行,具體步驟如下:
流程 | 子任務 | 說明 | 詳細指導 |
|---|---|---|---|
購買專屬集群 | 購買專屬集群 | 相比平臺提供的默認集群資源,購買專屬集群資源獨享,隔離性更好 注:非必要步驟,可以使用平臺提供的默認集群按需使用 | 需聯系客戶經理進行購買 |
創建隊列 | 創建隊列 | 在購買專屬集群后,可以將專屬集群資源按照一定維度劃分成多個隊列,供成員在工作空間內進行作業時使用 注:非必要步驟,非必需購買專屬集群,可以使用平臺提供的默認集群,默認集群無需創建隊列,可直接使用。 | |
數據集準備與處理 | 創建基礎數據集 | 可上傳基礎數據集到ZOS或HPFS | |
創建標注數據集 | 創建標注數據集,可對數據集進行標注,并發布為新的數據集 | ||
數據清洗 | 可以對數據進行清洗 | ||
鏡像準備 | 預置鏡像 | 預置鏡像即平臺預先設置的完整鏡像,可直接用于創建任務時使用 | |
自定義鏡像 | 可以通過開發機自主制作鏡像或通過天翼云容器鏡像服務將鏡像服務內的容器共享給一體化智算平臺 | ||
他人分享鏡像 | 可將自己的鏡像分享給他人使用 | ||
代碼準備 | 導入代碼包 | 將代碼上傳到平臺 | |
模型準備 | 導入模型 | 可將用戶自己的模型或在 平臺訓練、精調好的模型導入到平臺進行版本管理、評估及部署 | |
AI作業 | 模型開發 | 可通過啟動和管理在線JupyterLab或VSCode集成開發環境在線編程進行模型開發 | |
模型訓練 | 創建自定義創建訓練任務,支持單機和多機分布式訓練 | ||
模型精調 | 零代碼快速創建和管理精調任務,提供全參微調和lora微調兩種精調方式。基于平臺的基礎大模型,選擇訓練數據集和算力即可快速啟動精調任務。 | ||
模型評估 | 可對模型進行評估,自動評估打分,生成評估報告 | ||
模型壓縮 | 不減少模型效果的前提下壓縮模型大小,進而提升模型在推理調用時的性能 | ||
模型部署 | 部署模型,提供推理服務 | ||
綜合管理 | 成員管理 | 查看并管理本租戶下所有用戶的平臺使用情況 | |
總覽資源 | 平臺管理員能夠輕松查看并管理專屬集群的資源使用情況 | ||
調度中心 | 旨在讓平臺管理員能夠輕松查看并調度集群資源 | ||
設置 | 旨在讓平臺管理員能夠輕松查看并設置本租戶下所有用戶對資源使用的限額 |
子賬號使用流程
前置條件
子賬號為IAM普通用戶角色且已登錄到訓推智算服務平臺
子賬號使用流程
若子賬號為IAM管理員角色,則其擁有全部操作權限,操作流程和主賬號別無二致,故角色為IAM管理員的子賬號使用流程參見主賬號使用流程章節;角色為IAM普通用戶的子賬號,使用流程如下:
子賬號的使用流程主要是為了進行任務作業,具體步驟如下:
流程 | 子任務 | 說明 | 詳細指導 |
|---|---|---|---|
數據集準備與處理 | 創建基礎數據集 | 可上傳基礎數據集到ZOS或HPFS | |
創建標注數據集 | 創建標注數據集,可對數據集進行標注,并發布為新的數據集 | ||
數據清洗 | 可以對數據 | ||
鏡像準備 | 預置鏡像 | 預置鏡像即平臺預先設置的完整鏡像,可直接用于創建任務時使用 | |
自定義鏡像 | 可以通過開發機自主制作鏡像或通過天翼云容器鏡像服務將鏡像服務內的容器共享給訓推智算服務平臺 | ||
他人分享鏡像 | 可將自己的鏡像分享給他人使用 | ||
代碼準備 | 導入代碼包 | 將代碼上傳到平臺 | |
模型準備 | 導入模型 | 可將用戶自己的模型或在平臺訓練、精調好的模型導入到平臺進行版本管理、評估及部署 | |
AI作業 | 模型開發 | 可通過啟動和管理在線JupyterLab或VSCode集成開發環境在線編程進行模型開發 | |
模型訓練 | 創建自定義創建訓練任務,支持單機和多機分布式訓練
| ||
模型精調 | 零代碼快速創建和管理精調任務,提供全參微調和lora微調兩種精調方式。基于平臺的基礎大模型,選擇訓練數據集和算力即可快速啟動精調任務。 | ||
模型評估 | 可對模型進行評估,自動評估打分,生成評估報告 | ||
模型壓縮 | 不減少模型效果的前提下壓縮模型大小,進而提升模型在推理調用時的性能 | ||
模型部署 | 部署模型,提供推理服務 |