千亿参数AI模型Yi-Large在京发布

2024-05-14 17:14:45 来源: 科技日报作者: 华凌

科技日报记者华凌

5月13日，创新工场董事长兼CEO、零一万物CEO李开复博士，在北京发布零一万物千亿参数Yi-Large闭源模型，以及包括开源模型等产品矩阵。

据李开复介绍，第三方权威评测结果表明，零一万物Yi-Large的中英文双语表现都非常出色。在最新的斯坦福AlpacaEval2.0榜单上，Yi-Large模型的英语能力主要指标“控制回复的长度”名列世界第二，仅次于GPT-4 Turbo。此前，国内大模型仅有零一万物和Qwen曾登上此榜单的前20名。在中文能力方面，SuperCLUE发布的四月评测报告中，Yi-Large位列国产大模型之首，且综合中英双语能力都表现优异。在更全面的综合评测中，Yi-Large有多数指标超越GPT4、Claude3、Google Gemini 1.5等同级模型，在通用能力、代码生成、数学推理、指令遵循等方面均居领先，稳列全球第一梯队。

李开复表示，一系列权威测评表明，Yi-Large是当前可用的最好的AI大模型，不过零一万物仍在继续创新，正在训练规模更大的新模型Yi-XLarge。其将是一种混合专家大模型（MoE），虽然尚未完成最终训练，但是在一些权威评测中仍然做到与Claude-3-Opus、GPT4-0409最新旗舰级模型互有胜负。

李开复预见AI技术未来有几个趋势，包括持续Scaling Law（尺度规律），大模型能力快速增长，超过任何技术；同时大模型训练和推理成本持续大幅下降（GPT价格年内多次下调）；另外，需要顶级模型推理能力，才能实践最佳AI-First应用，但有些应用会先爆发，同时要考虑推理成本和商业模式的平衡。因此，寻找TC-PMF难度远远大于PMF，是大模型行业集体的挑战和机遇。

（科技日报记者华凌摄）

责任编辑：李梦一

千亿参数AI模型Yi-Large在京发布

友情链接