老外汉语好不好,AI能说了算?

2018-03-02 11:36:23 来源: 科技日报 作者: 饶高琦

新年结束后第一个工作周,第五届中文句法错误自动检测技术评测(Chinese Grammartical Error Diagnosis, CGED)悄悄拉开了战幕,人工智能学术界和工业界的不少单位即将在“帮老外批汉语作文”这一任务上一较高下。据介绍今年评测活动的竞争将十分激烈。这多少也和去年年底的AI批改留学生作文的热点事件有关。

2017年12月央视新闻一则《浙外引进阿里AI批改作文,不到200字作文看出8处错误》的新闻,引发各媒体关注和网友热议。据报道,一些较为隐蔽的错误点,甚至有经验的教师也无法立刻发现。

就像所有其他人工智能应用一样,一经众多媒体的宣传,自动作文批改就已经开始有点儿“威胁”汉语教师了。但查阅CGED技术评测的综述论文可知,经过超过五千个错误点测试后,即使是2016年和2017年技术评测第一名(哈工大与阿里巴巴)识别错误类型和错误位置的综合精度也都在40%以下。再加上留学生手写作文扫描识别为数字化文本环节的差错,错误识别的综合精度只会更低。另一方面,为了降低运算难度,评测还将真实语言教学中的几十种错误标记,归并为了冗余、缺失、错用、乱序四种大错误类型。由于评测中错误划分很粗,教师无法只通过错误统计就准确把握学生语言能力。总之,自动批改距离投入教学前线还有很大的差距。

人工智能领域有句很有道理的笑话:人工智能,没有人工就没有智能。相比高考作文,汉语作为第二语言的写作数据还较为稀缺。受教学模式、学习阶段和母语的影响,留学生容易出现的语法错误类型极富多样性。今天在大多数人工智能应用中取得辉煌战绩的深度神经网络模型对数据规模和质量的要求则更加苛刻。

目前市场上较为成功的人工智能应用大多都因为构建了“服务—用户—数据”的正反馈闭环,即通过智能服务扩大用户群体,大量用户产生数据,数据驱动模型进一步改进服务效果。这就要求人工智能服务在先期必须达到用户基本可以忍受的效果。而对于汉语作为第二语言的句法错误检测任务,虽然已经取得了不小的进步,但还无法开启如导航、广告推荐这样的正反馈闭环。正如黎明之前的黑暗最难熬,推动智能起飞之前的这段人工之路也最艰苦。但好在,语言处理被视作人工智能皇冠上的明珠,越来越多的资本和人力都在不断涌入。相信句法错误检测这样的细分领域在可预见的未来也能进入飞速发展期。届时教师省心、学生省力的批改机器人就不再只停留于展示中了。

另一方面,技术评测将助力技术发展。毕竟光说不练假把式,在同一数据平台上一较高下,方可刺激学界和业界苦练真功。期待今天还停留在展示和概念阶段的AI能高速成长,为汉语国际传播贡献力量。

加载更多>>
责任编辑: 符雪苑
专题 更多>>
国内 更多>>

《森林•环境与管理》系...

近日,由陈存根先生编著的《森林•环境与管理》系列丛书由科学出版社出版发行。该丛书集结了我国著名森林生...

《初心无悔:老法官见证...

《初心无悔:老法官见证中国司法改革40年》一书出版,近日由中国财政经济出版社正式出版发行。

院士团队向餐厨垃圾“宣...

1月17日,“利世康低碳产业园总部项目在四川省成都市新都区开工,中国工程院院士刘人怀的“联合生物加工处理...

重庆市五届人大二次会议...

22日,记者从重庆市五届人大二次会议新闻发布会上获悉,大会定于1月27日至31日举行,正式会期5天

从“标准”到“指南”医...

“围绕网络安全重点工作,不仅需要以问题为导向开展急需标准制定,同时还要加强标准宣贯和应用实施。”2019...

科报集萃 更多>>

专为老年人设计的小达人...

近日,小达人智能科技发布了旗下首款专为老年人设计的智能手机——小达人X1。

中国技术创业协会智慧建...

2019年1月19日,由国家科技部直属一级协会中国技术创业协会主办,中铁建工集团有限公司、中国技术创业协会技...

“雅思白皮书”发布:我...

平均来看,我国大陆考生在雅思上究竟是个什么水平?23日,英国文化教育协会正式发布《2018中国大陆地区雅思...

智能工厂出道!格力高精...

近日,“升级中国制造——2019中国智能制造全产业链应用大会”在东莞举办,格力智能工厂全员出动,再次集中...