科技日报记者 杨雪
近日,深度求索(DeepSeek)旗下DeepSeek-R1、V3、Coder等全系列大模型正式接入国家超算互联网平台。据介绍,DeepSeek-R1专注于自然语言处理,具备强大的文本生成能力;DeepSeek-V3聚焦于图像生成,能够生成高分辨率和细节丰富的图像,适用于广告、艺术创作等多个场景;DeepSeek-Coder是一款代码生成模型,能够协助开发者快速构建程序,提高开发效率。
超算互联网是以互联网思维运营超算中心,并连接产业生态中的算力供给、应用开发、运营服务、用户等各方能力和资源,构建一体化超算算力网络和服务平台。其目标是紧密连接供需双方,通过市场化的运营和服务体系,实现算力资源统筹调度,降低超算应用门槛,并带动计算技术向更高水平发展,推动自主核心软硬件技术深度应用,辐射带动自主可控产业生态的发展与成熟。
为促进超算算力一体化运营、打造国家算力底座,国家超算互联网平台去年4月正式上线,覆盖科学计算、工业仿真、人工智能(AI)模型训练等各个领域。
记者从国家超算互联网平台了解到,截至今年1月,平台上已有各类算力商品超6500款,其中模型服务近240款,既有DeepSeek、Qwen等国内开源大模型,也有Llama、Stable Diffusion、Gemma、Mistral、StarCoder、ChatGLM等国外开源模型。
对于DeepSeek的上线,国家超算互联网平台相关负责人表示,先进的国产AI技术与国家级综合算力服务平台融合,是加速国产AI技术生态发展与普及的前沿实践,其将在市场、技术、创新、产品及用户方面推动AI技术生态创新及成果落地,促进AI+的多样化,推动中国乃至全球AI市场的应用落地和产业化进程。通过国家超算互联网平台,用户无需本地下载,可在线部署、推理、定制化训练与开发DeepSeek等国内外知名开源大模型,降低了AI技术使用门槛。与此同时,算力服务的普惠性也得到提升,国家超算互联网平台依托国产深算智能加速卡与全国一体化算力服务体系,为DeepSeek等模型提供丰富的异构算力资源,为国产AI应用与创新提供持续算力保障。
DeepSeek系列模型在性能上与世界顶尖的大模型不相上下,但在成本上却具有显著优势。DeepSeek系列通过算法优化显著降低计算资源消耗,结合国家超算互联网平台“普惠易用、丰富好用”的能力,使得更多企业和用户能够负担得起AI技术的应用,加速AI技术普及。
业界普遍认为,DeepSeek模型在超算互联网平台的规模化落地,或将改变国内AI行业依赖海外闭源模型的现状。