2018年7月26日,应中科院自动化所副研究员、中文信息学会青年工作委员会执委张家俊老师和主任刘康老师的邀请,腾讯AI Lab高级研究员涂兆鹏博士走进中科院自动化所,为师生带来一场精彩的学术报告,引起热烈反响。
由于神经机器翻译是一个端到端的翻译系统,其对于输入中的微小扰动极其敏感。例如,将输入中某个词替换成其近义词,会导致输出结果发生剧烈变化,甚至修改翻译结果的极性。涂兆鹏博士介绍了对抗性稳定训练准则来同时增强神经机器翻译的编码器与解码器的鲁棒性。给定一个输入句子x,首先生成与其对应的扰动输入x’,接着采用对抗训练鼓励编码器对于x和x’生成相似的中间表示,同时要求解码器端输出相同的目标句子y。接着,涂兆鹏博士介绍了两种构造扰动输入的方法,第一种在特征级别(词向量)中加入高斯噪声,第二种在词级别中用近义词来替换原词,并解释了框架的泛化性能,即可以扩展到更多得噪声扰动方法。最后,涂兆鹏博士还根据自己的研究经历介绍了在研究中如何选题、如何寻找方法以及如何发表高水平论文的经验和方法,受到在场师生的高度赞誉。
涂兆鹏博士是腾讯AI Lab高级研究员,主要从事自然语言处理和深度学习方面的研究。在ACL, TACL, EMNLP, AAAI, IJCAI等国际顶级会议和期刊发表论文三十余篇,长期担任CL, ACL, EMNLP等国际顶级期刊和会议的审稿人,并担任EMNLP2018机器翻译领域主席和AAAI2019高级程序委员会委员。