,百川智能今日召开主题为“百川汇海,开源共赢”的大模型发布会,正式开源微调后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 与其 4bit 量化版本,并且均为免费可商用。
据百川智能官方介绍,Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6 万亿高质量多语言数据进行训练,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。
其中 Baichuan2-13B-Base 相比上一代 13B 模型,数学能力提升 49%,代码能力提升 46%,安全能力提升 37%,逻辑推理能力提升 25%,语义理解能力提升 15%。
在 MMLU、CMMLU、GSM8K 等基准测试中,百川智能的两个模型都比 LLaMA 2 的分数要高一些,且在“中文通用”部分优势较大。
Baichuan2-7B 和 Baichuan2-13B 不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业均参加了本次发布会并与百川智能达成了合作。
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
感谢IT之家网友华南吴彦祖的线索投递!,lifeme魅蓝G1游戏...
,游戏工作室DICE今天公布将于6月7日推出《战地2042》游戏...
2023年5月24日至26日,SNEC第十六届国际太阳能光伏与智...
5月26日,信美人寿相互保险社召开六周年发布会,并正式发布“信·...
手握独家专利品种疏风解毒胶囊这一核心产品,安徽济人药业股份有限公...
今日,浙江双元科技股份有限公司首次公开发行股票并在科创板上市网上...