2017年12月20日,应天津大学副教授张鹏老师的邀请,中科院计算所郭嘉丰教授来到天津大学计算机学院做了一场题为“Neural Information Retrieval — From Matching To Decision”的报告,张鹏老师主持了本次报告。参加本次报告会的包括天津市千人计划教授宋大为老师,青工委委员贺瑞芳老师,还有其他实验室师生共计30余人。
在本次报告中,郭老师介绍了一系列Neuro IR的前沿进展。首先针对短文本排序,采用语义匹配的方式,并将文本匹配问题建模为图像识别的问题;针对长文本排序,采用相关性匹配的方式,提出了面向Ad-hoc检索任务的深度关联匹配模型(DRMM),该模型使用匹配直方图映射、前馈匹配网络和术语门控网络有效的处理了相关性匹配中的难题。为模拟人类的判断过程,提出了基于文本匹配的决策模型——DeepRanking,此模型很好地捕获了重要的IR特征,包括准确的/语义匹配的信号,接近启发式,查询词的重要性,以及多样性相关的需求;考虑到网页是结构化的布局,提议从网页的布局中自动学习丰富的视觉特性为相关性排名,并提出了一种新的视觉感知模型,该模型受人类视觉搜索行为的启发,在页面视觉上提取视觉特征,学习的视觉特性可以显著提高在特定Web检索任务中相关性排名的性能。最后,郭老师还介绍了一个旨在帮助设计、比较和共享深度文本匹配模型的工具箱——MatchZoo。
报告结束后,郭老师与在座的师生进行了深入的交流,进一步了解了郭老师团队的工作,对实验室研究工作有了深刻的启发,提供了新的思路。
郭嘉丰,博士,现任中科院计算机技术研究所研究员,中国科学院大学岗位教授,国家自然科学基金优秀青年基金获得者,中文信息学会信息检索专委会副主任兼秘书长。长期从事信息检索与数据挖掘方向的基础研究,研究方向包括用户查询理解、排序学习、文本建模、神经网络搜索等。在本领域国际重要学术会议与期刊上发表学术论文80余篇(如TKDE、SIGIR、AAAI、CIKM等),Google Scholar累计引用2200余次,获得ACM CIKM 2011最佳论文奖,ACM SIGIR 2012最佳学生论文奖,ACM CIKM 2017最佳论文Runner-up奖,2012年国家科技进步二等奖、2012年中国中文信息学会“钱伟长中文信息处理科学技术奖——汉王青年创新奖”一等奖,2016年中科院青年促进会优秀会员等。