模型簡介
Baichuan 2 是百川智能推出的新一代開源大語言模型,在多個權威的中文和英文基準測試(benchmark)上均取得了同尺寸模型中的最佳效果。此次發布,Baichuan 2 提供了7B和13B的Base版本以及Chat版本,同時,為了提升部署效率和降低資源消耗,還特別為Chat版本提供了4-bit量化的版本。
使用場景
在實際應用方面,Baichuan 2在垂直領域如醫學和法律方面表現突出。 這種規模的模型可以更加人性化地執行各種自然語言任務,如問答、翻譯、摘要生成等。 此外,Baichuan 2還可以應用于智能客服 、智能助手等場景,提高用戶體驗和滿意度。
評測效果
百川智能在通用、法律、醫療、數學、代碼理解以及多語言翻譯這六個領域的中英文權威數據集上,對Baichuan 2模型進行了全面的測試。更多詳細的測評結果,請訪問GitHub上的相關倉庫進行查看。
技術亮點
在預訓練方面,Baichuan 2采用了廣泛的數據來源,并注重數據頻率和質量。通過構建大規模去重和聚類系統,Baichuan 2實現了高效的數據處理,確保每個token都得到充分訓練。此外,Baichuan 2的分詞器也進行了優化,實現了高壓縮率和適當大小的詞匯表,以提高模型的推理效率和訓練效果。
在應用方面,Baichuan 2支持多種任務類型,包括文本生成、文本分類、實體識別等。通過監督預訓練和強化學習從人類反饋中獲得的方法,Baichuan 2實現了模型對齊,獲得了Baichuan 2-7B-Chat和Baichuan 2-13B-Chat兩個會話模型,進一步提升了模型在自然語言處理任務中的性能。
聲明與協議
聲明
百川智能的開發團隊并未基于 Baichuan 2 模型開發任何應用,無論是在 iOS、Android、網頁或任何其他平臺。強烈呼吁所有使用者,不要利用 Baichuan 2 模型進行任何危害國家社會安全或違法的活動。另外,百川智能也要求使用者不要將 Baichuan 2 模型用于未經適當安全審查和備案的互聯網服務。希望所有的使用者都能遵守這個原則,確保科技的發展能在規范和合法的環境下進行。
百川智能已經盡可能確保模型訓練過程中使用的數據的合規性。但由于模型和數據的復雜性,仍有可能存在一些無法預見的問題。因此,如果由于使用 Baichuan 2 開源模型而導致的任何問題,包括但不限于數據安全問題、公共輿論風險,或模型被誤導、濫用、傳播或不當利用所帶來的任何風險和問題,百川智能不承擔任何責任。
協議
使用 Baichuan 2 模型需要遵循 和。Baichuan 2 模型支持商業用途,如果您計劃將 Baichuan 2 模型或其衍生品用于商業目的,請您確認您的主體符合以下情況:
您或您的關聯方的服務或產品的日均用戶活躍量(DAU)低于100萬。
您或您的關聯方不是軟件服務提供商、云服務提供商。
您或您的關聯方不存在將授予您的商用許可,未經百川許可二次授權給其他第三方的可能。
在符合以上條件的前提下,您需要通過以下聯系郵箱 opensource@baichuan-inc.com,提交《Baichuan 2 模型社區許可協議》要求的申請材料。審核通過后,百川將特此授予您一個非排他性、全球性、不可轉讓、不可再許可、可撤銷的商用版權許可。
免責聲明
Baichuan2-7B模型來源于第三方,本平臺不保證其合規性,請您在使用前慎重考慮,確保合法合規使用并遵守第三方的要求。