新华社记者 郭爽
近来,中国人工智能(AI)领域,特别是大型语言模型技术迅猛发展。多方评论指出,中国AI技术的快速发展,让美国打压政策尽显尴尬。
世界经济论坛2025年年会开幕当天,中国深度求索公司发布其最新开源模型DeepSeek-R1,这一模型在技术上实现了重要突破——用纯深度学习的方法让AI自发涌现出推理能力。该模型延续了其高性价比的优势。据该公司介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩美国开放人工智能研究中心(OpenAI)的o1模型正式版。
中国AI技术在瑞士达沃斯举办的世界经济论坛2025年年会的相关讨论中成了热议话题。美国麻省理工学院知名AI专家马克斯·特格马克教授在年会上接受新华社记者专访时说,去年以来,中国在AI领域取得了巨大进步。特格马克高度赞扬中国深度求索公司最新发布的大型语言模型。
他指出,如果说一年前中国在前沿大型语言模型上略显落后的话,现在中国已基本赶上,这更显示出因地缘政治而破坏科技合作这一行为的“愚蠢和错误”。
过去一年,中国在AI领域发展迅速。OpenAI在2024年9月发布了推理模型o1。仅隔数月,中国企业阿里巴巴的通义千问团队在2024年11月底推出了实验性研究模型QwQ-32B-Preview,该模型在多个测试中展现出了与OpenAI的o1模型相当甚至超越的推理能力。中国深度求索公司在2024年12月下旬发布混合专家模型DeepSeek-V3。测试结果显示,它的多项评测成绩超越了Llama-3.1-405B等开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲,并且DeepSeek-V3还具有成本优势。
OpenAI在2024年2月初发布视频生成模型“天空”后,中国短视频平台快手公司在2024年6月发布视频生成大模型“可灵”。在随后几个月里,包括智谱AI、字节跳动以及腾讯在内的一批中国公司也推出了类似工具。
英国《经济学人》杂志撰文指出,美国试图阻止中国在AI领域的追赶,但中国最近的进展正在颠覆整个AI行业,让美国政策制定者感到“尴尬”。中国模式的成功,加上整个行业的变化,可能会重塑AI行业的经济模式。
美国《纽约时报》刊登的一篇文章说,与谷歌和OpenAI等美国巨头的产品相比,中国公司打造了一款更便宜、更有竞争力的模型。
美国乔治·华盛顿大学专门研究新兴技术和国际关系的助理教授杰弗里·丁(音)表示,美国对中国芯片的限制迫使中国工程师“更有效地训练它(模型),以使其仍然具有竞争力”。
除了大型语言模型外,物理AI也将给中国带来良好机会。中国禾赛科技联合创始人李一帆在达沃斯论坛期间指出,当把数字世界的AI和物理产品结合的时候,人们会发现无论是车、机器人,还是其他消费电子产品领域,中国企业在供应链、最终制造能力、最终完整闭环、成本控制、最终上量等的能力方面,都具有很大优势。