科技日报记者 吴长锋 洪敬谱
记者7日从安徽省量子计算工程研究中心获悉,本源量子计算科技(合肥)股份有限公司、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在我国超导量子计算机“本源悟空”真机上,实现十亿级参数AI大模型微调任务的全球首次运行。
实验结果显示,在参数量减少76%的前提下,训练效果反而提升8.4%。这一成果不仅验证了量子计算助力实现大模型轻量化的可行性,更为破解大模型“算力焦虑”开辟了新路径。
微调是指在通用大模型(如DeepSeek、Qwen)的基础上,通过进一步训练特定领域数据,使其适应医疗诊断、金融风控等专业场景。传统低秩微调面临性能瓶颈、泛化能力有限等问题,量子计算凭借其叠加态和纠缠态特性可同时探索海量参数组合,可提升大模型微调的效率。
“就好比给经典模型装上了‘量子引擎’,让两者协同发力。”本源量子副总裁窦猛汉表示,团队创新设计了“量子加权张量混合参数微调”,通过量子计算特性实现智能“微调”——将模型权重转化为量子神经网络与张量网络混合架构,前者通过量子门操作提取高维非线性特征,张量网络则压缩参数规模。
合肥综合性国家科学中心人工智能研究院副研究员陈昭昀说:“这是量子计算首次‘真机实战’大模型任务,证明现有硬件已能初步支撑大模型微调。”
在“本源悟空”的量子芯片上,单批次数据可生成数百个量子任务并行处理。实验数据显示,优化后的模型在心理咨询对话数据集(CPsyCountD)上训练损失降低15%,数学推理任务(R1-Distill-SFT)的严格准确率从68%提升至82%。
据介绍,“本源悟空”是目前我国先进的可编程、已交付超导量子计算机,已为全球139个国家超2300万人次提供量子算力云服务,完成35万个量子运算任务,涵盖流体动力学、金融、生物医药等多个行业领域。此外,该量子计算机还成功完成全球最大规模的量子计算流体动力学仿真,并接入金融量子云实验平台,用于探索金融领域更高效的问题解决方案。