全国产深度推理大模型讯飞星火X1推理性能再次升级

2025-04-22 15:20:54 来源: 科技日报 点击数:

科技日报记者 都芃

4月20日,科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上的效果显著提升,并且通过融入更多场景复杂类型数据,模型应用更具泛化性,在多类行业任务上展现出不俗实力。讯飞星火X1在模型参数比业界同类模型小一个数量级的情况下,实现效果持平,再次证明了基于全国产算力的全栈自主可控大模型具备持续创新潜力。

升级后的星火X1在多种任务中展现出优异性能,尤其是在数学、知识问答等方面表现突出。在数学答题和复杂的数理逻辑推理方面,星火X1能够准确识别出复杂的数学公式,不仅给出完整的解题思路,输出结果也严谨清晰;在逻辑推理时,其能全方位思考,考虑可能出现的每一种假设,表现出更强的严谨性和准确性。在代码能力方面,星火X1提高了代码生成的准确率,能够应对更复杂的编程需求,思考问题的多种可能性,帮助开发者快速实现功能开发。在语言理解方面,模型输出内容、格式更加符合用户指令要求,能够给出更加准确且经过深度思考的结果,生成内容更加连贯、准确。

本次星火X1升级不仅提升了通用能力,也同步增强了面向行业的解决方案能力。例如在司法行业中,当用户要求其根据材料,总结案件事实以及判决理由时,升级后的星火X1能够精准把握用户指令,详细分析争议点,快速定位关键信息,并输出准确内容,为行业用户提供专业、可靠的智能支持。

讯飞星火X1的全新升级背后,是一系列技术创新与理念突破。其提出的基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性;强化学习动态更新算法,则基于样本采样长度动态调整强化学习更新速度,进一步提升深度思考、强化学习效率及效果。

并且,此次星火X1还首发快思考、慢思考统一模型,由一个模型同时支持两种思考模式,充分发挥快、慢思考数据相互促进作用,实现基于系统指令控制模型是否深度思考的功能,提升了模型处理不同复杂度任务的能力,支撑下游更高效便捷地部署使用。满血版星火X1仅需4张卡(华为910B)即可部署,简化了私有化部署流程。此次星火X1还实现多项工程技术创新,实现了国产算力平台上高效、稳定的全流程强化学习训练。

责任编辑:孙莹

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览