一年四次夺冠,凭什么?

Posted by HFL-RC on April 18, 2018

本文转自哈工大讯飞联合实验室微信公众号

在那些寒窗苦读的学生时代,在无数个奋笔疾书的考场上,你一定碰见过一种作业题型——“阅读理解”。

它需要融会贯通进行主观陈述和作答,是难度系数比较高的题型之一。其实“阅读理解”并不是人类才有的“苦恼”,机器也同样需要过这一关。

就着阅读理解这事,科大讯飞AI研究院副院长王士进和研究主管崔一鸣今天将和大家聊聊背后的故事——他们的团队已连续在机器阅读理解的比赛上摘得全球桂冠。

今年2月10日,科大讯飞又拿奖了。

在SemEval 2018国际语义测评大赛的机器阅读理解评测任务中,哈工大讯飞联合实验室(HFL)荣获桂冠。在此之前,从去年7月开始,实验室已在机器阅读理解领域权威评测大赛SQuAD连续3次刷新世界纪录。

“给定一个日常生活场景的描述文本及相关问题,我们需要利用常识和知识让机器从候选答案中挑选出正确答案。”这其中利用了机器阅读理解的相关技术,“我们把从融合式层叠注意力系统分拆的技术,应用到其他自然语言处理任务中。”

阅读理解先审题后答题,这其中蕴含了一整套逻辑理解的关系,人处理起来都不太容易、机器如何拥有这项能力?“其实人和机器的解题过程有区别。”

崔一鸣介绍,人在审题和做题的时候通常要结合自身已掌握的常识和知识,并且综合全文的信息做进一步归纳、推理,这个过程相对较为多元化。

而对于目前的机器来说,首先需要“阅读”大量的篇章和问题,并且计算出篇章、问题之间语义级别的匹配程度,从而更好地抽取出与解题相关的内容。“所以对于机器来说,更能够答好之前见过的问题,而缺乏一些多元化、综合解题的能力。”

说得坦率些,虽然目前机器在某些阅读理解数据集上的水平超过了人类,但这并不能表明“机器打败了人类”。“现在的技术距离通用型人工智能其实还很远,机器还无法能够模拟很多人类的智能。”王士进解释,通用性不够强、需依赖大量有标注的数据,都是目前机器阅读理解的局限性。

让机器能理解会思考,让机器具备真正的推理能力,其实还有很长一段路要走。“理论框架上必须进行突破,而不是简单的升级。”王士进这样认为:首先机器要能从海量数据学会推理、掌握知识和常识,然后还需要机器从小样本数据上学会同样的事情。

因为有这样的研究目标,拿奖对于科大讯飞AI研究院而言,似乎是水到渠成。“SemEval2018上夺冠从时间上是意料之外,但从技术角度来说也是情理之中。”

事实上,准备这项大赛,团队只用了1个半月左右。“因为当时在工程项目上需要进行技术攻关,偶然了解到今年这项比赛中有机器阅读理解的任务,便抽出部分时间来参与。模型设计花费了1-2周,后续还做了参数调整和效果优化。”崔一鸣坦言,对于新任务团队本也没有十足的夺冠把握,只是从技术积累看有希望。

“冠军不是目标,只是我们技术的试金石,体现的是核心技术的领先优势。”坐拥机器阅读理解领域的多项世界纪录和世界冠军,团队显得既霸气又谦虚。

而今,在被誉为“人工智能领域皇冠上的明珠”的机器阅读理解大赛中,除了几家常驻的研究机构之外,还有来越多的科技公司、甚至互联网公司、创业公司加入,“这样有助于促进该领域技术的进步。”

对于科大讯飞而言,如果参赛却没有拿到冠军,是不是意味着失败?“胜败乃兵家常事,技术的发展是螺旋式、曲折式的上升发展,讯飞有耐心去包容这样的‘失败’。”

也许正如那个道理:任何领域都没有常青树。技术上亦如此,为了获得持续发展的源动力,科大讯飞不仅自己拿冠军,还在帮助别人拿第一。

崔一鸣透露,2016年科大讯飞发布了首个中文填空型阅读理解数据集PD&CFT。2017年,科大讯飞携手中国中文信息学会计算语言学专委会(CIPS-CL)共同举办了首届“讯飞杯”中文机器阅读理解评测(CMRC 2017),并与全国计算语言学会议(CCL)共同召开,为相关学者提供了一个良好的沟通平台。

今年,讯飞还会继续举办第二届“讯飞杯”中文机器阅读理解评测(CMRC 2018),和更多研究人员共同推动中文机器阅读理解的研究发展。

从某种意义而言,让机器能“阅读理解”是人工智能向着高阶发展的尝试。机器能理解、会思考,就是我们常常所说的认知智能。它主要体现在人机交互和行业应用上,“认知智能的发展和逐步成熟,会使得人机交互逐渐便捷有效,会学习和固化行业专家和行业大数据的经验,对各个行业产生颠覆式的创新。”

相关的应用已经开始。王士进说,目前讯飞在多个应用领域使用自然语言处理等技术促进产品帮助人类。比如讯飞的“智医助理”在去年全球首次参加并通过国家执业医师资格考试笔试评测;比如通过人工智能的知识图谱和习得顺序分析可以精准分析每个孩子的学习情况,从而有针对性的布置个性化作业,大幅降低无效重复学习时间……

对语言本身的处理和应用也有更广的尝试。“讯飞听见会议系统可实时将语音转写成文字,不仅有中文还有英语;讯飞翻译机也已具备了7种语言的互译功能,未来还将开发更多国家语言翻译功能,布局相关语种的语音识别技术、语音合成技术、机器翻译技术。”

有没有不太满意的地方呢?瑕疵肯定存在,王士进以智能阅卷技术的应用举例,坦言计算机评分也存在错误的情况,但这并不妨碍研发、应用的大势,“未来,随着人工智能技术的发展,机器可以自动学习教师的评卷方法,除了开放式作文,在其他科目、甚至政史地问答题等试题的批阅中,机器都可以自动阅卷。”如此将大大解放教师们时间和精力,“他们将投入到对教学方法、教学手段等创造性工作的研究中,相学生们也会因此获得更好、更全面的教育。”

所以,“阅读理解”只是开始,包括讯飞AI研究院在内,攻克它只是核心技术研究上的一点突破,更大的意义在于构建研究生态和让研究应用真正发挥价值。

Nothing special