新闻排行
学术动态

计算机学院2017级本科生孙维纬在信息检索顶级会议SIGIR上以第一作者发表两篇论文

发布日期:2021年05月21日    点击次数:

近日,计算机科学与技术学院2017级本科生孙维纬作为第一作者的两篇论文“Conversations Powered by Cross-Lingual Knowledge”和“Simulating User Satisfaction for the Evaluation of Task-oriented Dialogue Systems”被信息检索顶级学术会议SIGIR 2021(The 44th International ACM SIGIR Conference on Research and Development in Information Retrieval)分别录用为Full paper和Resource paper,今年Full Paper录用率仅为21%。论文指导教师为山东大学计算机科学与技术学院任昭春教授。

论文“Conversations Powered by Cross-Lingual Knowledge”关注构建智能化的闲聊机器人。人类可以与机器对话,是人工智能研究的重要目标。近年来,为了生成更具有信息的回复,很多工作在对话系统中引入外部知识(如维基百科的文档)。但由于不同语言可获取的资源数量不平衡,对于资源匮乏的语言,现有方法施行起来存在困难。为了解决这一问题,论文作者首次提出了基于跨语言知识的对话(CKGC)方法。CKGC基于对话历史,从外语知识库中检索相关知识,再根据检索到的外语知识生成回复。同时,作者提出了一个无监督的学习方法来训练模型,通过大量实验发现该方法超过了目前已有的方法。此外,作者还发布了第一个CKGC基准数据集。论文在双盲匿名评审中获得了3个审稿人一致Accept的审稿意见,领域主席评价论文工作创新性和实现性强,实验设计出色。

论文“Simulating User Satisfaction for the Evaluation of Task-oriented Dialogue Systems”关注对话系统评价问题。任务型对话系统旨在解决用户的特定需求。作者发现,用户在与系统交互时的满意度变化,对用户接下来的行为有明显影响,而之前的工作在建模用户行为时并没有考虑用户满意度的变化。为此,作者提出了“用户满意度模拟”任务,通过对聊天过程中用户满意度的模拟,来提升用户模拟的真实性。同时,作者发布了一个标注数据集USS。该数据集覆盖多个领域,在规模上超过目前已有数据集,论文提出的任务和数据集将为未来的对话系统自动评价方法提供有力支撑和新的研究思路。

孙维纬是山东大学计算机科学与技术学院数据科学与大数据技术新工科创新实验班2017级本科生。近年来,山东大学计算机学院持续推进本科生的科研实践活动,为学生提供丰富的科学研究体验机会。孙维纬从大三开始在山东大学信息检索实验室担任科研助理。在此之前,他曾获CCF-CSP全国第二名(400分)、全国大学生数学建模二等奖。在信息检索实验室作为研究助理期间,孙维纬曾以共同作者身份在SIGIR 2020上发表一篇Full Paper。目前,孙维纬同学已经保研至山东大学计算机学院信息检索实验室,将于2021年9月开始硕士阶段学习。

【 作者:孙维纬   摄影:孙维纬    来源:计算机科学与技术学院     责任编辑:丁璇    】

相关阅读

读取内容中,请等待...