科技日报记者 王祝华
4月28日,崖州湾国家实验室精准设计与智造团队与中国农业大学、上海人工智能实验室共同发布首个种业大语言模型“丰登”。该模型集成了先进的人工智能技术与大数据分析,对海量来自不同渠道的育种科研文献、技术书籍及网络资源进行深度解析和索引,在品种选育过程、农艺性状描述、栽培技术推荐和历史推广区域查询等四大应用场景中,为用户提供解释和回答。
崖州湾国家实验室相关负责人介绍,“丰登”模型在由国内育种专家制定的标准测评中的表现,远超农学相关专业本科生,其综合得分是本科生的4.87倍。
为全面评估“丰登”的专业性能,研究团队组织育种专家设计了100道水稻育种专业问题和对应标准答案,涵盖了上述四大应用场景。测评结果表明,“丰登”在最佳答案个数和综合分数上的表现均超出预期,且在多个评估维度上超越了语言模型国际领先水平代表Anthropic Claude3和OpenAIGPT-4。这些成果充分证明了“丰登”种业大语言模型在处理水稻育种相关知识方面的潜力。
“丰登”v0.1拥有200亿参数,现已开放水稻相关知识的测试接口申请。首批参与测试的单位除崖州湾国家实验室和中国农业大学外,还包括隆平高科、中国科学院、中国农业科学院、正大集团、复旦大学、华中农业大学、华南农业大学、上海市农业科学院、广东省农业科学院等。
为进一步提升“丰登”大语言模型在实际应用中的效果和普适性,崖州湾国家实验室通过科技日报发出邀请,诚邀国内育种领域各单位参与研发,提供高质量语料,涵盖更多品种,助力中国种业发展。