我国人工智能基础设施企业清程极智联合清华大学翟季冬团队14日开源我国自研大模型推理引擎——“赤兔”(Chitu),首次实现国产AI芯片对新一代FP8模型(8位浮点数)的原生支持,为构建自主可控的国产AI算力生态提供了又一支撑。
随着DeepSeek引燃市场对大模型私有化部署的热情,模型部署的效率与成本成为企业AI落地的关键。当前,以FP8数据类型为代表的新一代AI模型成为行业主流。国产芯片多大程度上支持FP8数据类型,关系到新一代AI模型能否发挥出更优性能。
“过去,如果采用国产芯片支持FP8模型,传统技术方案需将FP8模型提前转换为FP16或BF16格式才能运行,这将导致性能损失,而推理引擎‘赤兔’通过硬件适配优化,无需提前转换模型,即可实现‘无痛’‘无损’支持FP8数据类型。”清华大学计算机系长聘教授翟季冬介绍。
为突破这一瓶颈,我国人工智能基础设施企业清程极智与清华大学翟季冬教授团队联合攻关,自主创新研发推理引擎“赤兔”并将其开源。推理引擎“赤兔”采用国际领先的全栈性能调优方案,可“四两拨千斤”地挖掘国产芯片潜力,实现国产芯片对FP8模型的原生支持。
“赤兔”的最大优势是实现对国产芯片的降本增效:不仅显著提升推理效率,也将降低部署成本。研发人员告诉记者,部署DeepSeek-R1等FP8模型时,基于“赤兔”的国产芯片方案将降低算力消耗,硬件成本与运维门槛也会同步下降。这为我国人工智能基础设施自主化开辟新路径的同时,也将为金融、工业、医疗等领域的智能化转型提供高性价比的支撑。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
感谢IT之家网友华南吴彦祖的线索投递!,lifeme魅蓝G1游戏...
,游戏工作室DICE今天公布将于6月7日推出《战地2042》游戏...
2023年5月24日至26日,SNEC第十六届国际太阳能光伏与智...
5月26日,信美人寿相互保险社召开六周年发布会,并正式发布“信·...
手握独家专利品种疏风解毒胶囊这一核心产品,安徽济人药业股份有限公...
今日,浙江双元科技股份有限公司首次公开发行股票并在科创板上市网上...