科技日报记者 华凌
5月13日,创新工场董事长兼CEO、零一万物CEO李开复博士,在北京发布零一万物千亿参数Yi-Large闭源模型,以及包括开源模型等产品矩阵。
据李开复介绍,第三方权威评测结果表明,零一万物Yi-Large的中英文双语表现都非常出色。在最新的斯坦福AlpacaEval2.0榜单上,Yi-Large模型的英语能力主要指标“控制回复的长度”名列世界第二,仅次于GPT-4 Turbo。此前,国内大模型仅有零一万物和Qwen曾登上此榜单的前20名。在中文能力方面,SuperCLUE发布的四月评测报告中,Yi-Large位列国产大模型之首,且综合中英双语能力都表现优异。在更全面的综合评测中,Yi-Large有多数指标超越GPT4、Claude3、Google Gemini 1.5等同级模型,在通用能力、代码生成、数学推理、指令遵循等方面均居领先,稳列全球第一梯队。
李开复表示,一系列权威测评表明,Yi-Large是当前可用的最好的AI大模型,不过零一万物仍在继续创新,正在训练规模更大的新模型Yi-XLarge。其将是一种混合专家大模型(MoE),虽然尚未完成最终训练,但是在一些权威评测中仍然做到与Claude-3-Opus、GPT4-0409最新旗舰级模型互有胜负。
李开复预见AI技术未来有几个趋势,包括持续Scaling Law(尺度规律),大模型能力快速增长,超过任何技术;同时大模型训练和推理成本持续大幅下降(GPT价格年内多次下调);另外,需要顶级模型推理能力,才能实践最佳AI-First应用,但有些应用会先爆发,同时要考虑推理成本和商业模式的平衡。因此,寻找TC-PMF难度远远大于PMF,是大模型行业集体的挑战和机遇。
(科技日报记者 华凌 摄)