中文信息处理实验室两篇论文被IJCAI 2022录用
近日,人工智能领域顶级会议IJCAI 2022录用结果出炉,中国科学院软件研究所中文信息处理实验室两篇论文被IJCAI 2022录用。以下是论文介绍:
论文一
标题:Bridging the Gap between Reality and Ideality of Entity Matching: A Revisting and Benchmark Re-Constrcution
作者:Tianshu Wang, Hongyu Lin, Cheng Fu, Xianpei Han, Le Sun, Feiyu Xiong, Hui Chen, Minlong Lu, Xiuwen Zhu
简介:实体匹配(Entity Matching)是实体解析(Entity Resolution)的关键步骤,虽然深度学习方法在当前基准上取得了优异的性能,但实际应用却并非如此。本文中,我们强调这种差别源于不合理的基准构建,从而带来了对匹配方法评价的偏差。为此,我们构建了一个新的语料库,并重新构建了开放实体、不平衡标签以及多模态记录的实体匹配基准。实验结果表明,之前基准引入的不合理假设掩盖了该任务的主要挑战,造成了对现有方法的高估。
论文二
标题:Towards Robust Dense Retrieval via Local Ranking Alignment
作者:Xuanang Chen, Jian Luo, Ben He, Le Sun, Yingfei Sun
简介:稠密检索(Dense Retrieval, DR)已经被广泛应用于文本检索任务中。同时,最近有研究表明,DR模型对查询变体(Query Variations,如带拼写错误的查询)并不够鲁棒,甚至有高达50%的性能下降。针对该问题,考虑到查询变体直接造成的是查询向量在表示空间中的位置偏移,我们认为保证查询变体在表示空间中的相对位置是比较重要的。因此,本文提出了一种局部排序对齐机制来提升DR模型的鲁棒性,即通过校准批次内的查询-文档的排序关系来达到查询变体向原查询的空间对齐。在MS MARCO和ANTIQUE数据集上的结果表明,本文提出的方法在原查询和各类查询变体上都能带来一定的性能增益,并且能够提升当前已有DR模型(如ANCE、TAS-Balanced等)的有效性和鲁棒性。
国际人工智能联合会议(International Joint Conference on Artificial Intelligence, 简称为IJCAI)是人工智能领域中最主要的学术会议之一,IJCAI 2022将与ECAI一起于2022年7月23-29日在奥地利维也纳举行。
撰稿:陈轩昂、王天舒
责任编辑:刘汇丹