Monthly Archives: December 2018

//December

2018年实验室代表性论文介绍

2018-12-25T10:33:00+00:00

2018年实验室代表性论文介绍 一、基于区块提议网络的中文事件检测 事件检测则是事件抽取中的一个关键步骤。近年来,随着基于神经网络方法的发展,人们常常将事件检测转化为一个词级别的分类问题来对待。然而,基于词级别分类的事件检测方法没有考虑到事件触发词块与词的不匹配问题。特别是在中文当中,有许多的事件触发词块并不是一个特定的词。 针对上述问题,我们提出了一种基于区块提议网络的中文事件检测方法。具体地,我们的方法首先使用动态多池化卷积神经网络抽取字符级别和词级别的混合特征。之后基于混合特征的触发词块生成器可以在字符级别上直接给出整个触发词块的检测结果,从而避免了事件触发词块与词的不匹配问题。实验结果表明我们的方法在事件检测标准数据集TAC-KBP2017以及ACE2005上取得了State-of-the-Art性能。 上述成果长文发表在自然语言处理顶级国际会议ACL 2018会议上: Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun. Nugget Proposal Networks for Chinese Event Detection. In: Proc. of the 56th Annual Meeting of the Association for Computational Linguistics, pp. 1033-1043. Melbourne, Australia (ACL 2018) (CCF-A)   二、用于信息检测的动态缩放优化方法 信息抽取中的许多问题均可以被视为信息检测任务。与传统分类问题不同的是,信息检测任务有着显著的类别不平等问题。这种类别不平等主要表现在数据分布以及使用的评价指标上。这使得传统基于交叉熵的优化目标无法得到较好的优化结果。 针对上述问题,我们提出了一种基于动态重要性缩放的信息检测模型优化算法。该方法借用了经济学中的边际效用的理论,首先基于每个类别相对于评价指标的边际效用计算每个类别的重要性。之后在优化模型的过程当中,我们将该重要性加入到目标函数当中,从而使得整个优化过程能够与评价指标更加吻合。同时,我们还提出了一种具体的、用于批处理的神经网络检测模型的动态重要性缩放方案。我们的方法在中英文事件检测标准数据集TAC-KBP2017上取得了State-of-the-Art性能以及更好的优化稳定性。 上述成果长文发表在自然语言处理顶级国际会议ACL 2018会议上: Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun. Adaptive Scaling for Sparse Detection in Information Extraction. In: Proc. of the 56th Annual Meeting of the Association for Computational Linguistics, pp. 1033-1043. Melbourne, Australia (ACL 2018) (CCF-A)   三、基于半监督的词典学习的语义解析 词典是基于组合语义的语义解析方法的基础,传统的词典需要从(句子,逻辑表达式)的标注对中学习,这类方法的缺点是需要大量的标注语料,并且存在词典覆盖度不够的问题。近年来,语义解析逐渐从受限领域扩展到开放领域,进一步加剧了词典覆盖度不够的问题。 为了解决上述问题,我们提出了一种基于半监督的词典学习方法。该方法利用容易获取的文本语料和词汇资源来扩充词典。该方法的出发点是:相似语义的词语应该映射到相同或相近的谓词。具体的,我们提出基于图的半监督学习框架,利用文本与文本之间的语义相关性来从种子词汇中学习新词汇,从而提高词典的覆盖度。我们在两个公开数据集上进行了实验,实验表明:我们的方法远远超过了基准系统,特别是大大提高了基准系统的召回率,这得益于扩充后的词典覆盖度更高。 上述成果长文发表在自然语言处理重要国际会议COLING-2018会议上: Bo Chen, Le Sun and Xianpei Han. Semi-Supervised Lexicon Learning for Wide-Coverage Semantic [...]

2018年实验室代表性论文介绍 2018-12-25T10:33:00+00:00