February 2022 – ICIP站点

中文信息处理实验室5篇长文被ACL 2022录用

root 2022-02-25T19:02:57+00:00

中文信息处理实验室5篇长文被ACL 2022录用近日，自然语言处理领域顶级会议ACL2022录用结果出炉，中国科学院软件研究所中文信息处理实验室五篇长文被ACL 2022录用，其中主会论文4篇，Findings论文1篇。以下是论文列表及介绍：论文一标题：Unified Structure Generation for Universal Information Extraction 作者：Yaojie Lu, Qing Liu, Dai Dai, Xinyan Xiao, Hongyu Lin, Xianpei Han, Le Sun, Hua Wu 简介: 本文提出了一个面向信息抽取的统一文本到结构生成框架UIE，它可以统一地建模不同的IE任务，自适应地生成目标结构，并从不同的知识来源统一学习通用的信息抽取能力。具体来说，UIE通过结构化抽取语言对不同的信息抽取目标结构进行统一编码，通过结构化模式提示器自适应生成目标结构，并通过大规模结构化/非结构化数据进行模型预训练捕获常见的IE能力。实验结果表明，本文提出的统一生成框架在实体、关系、事件和情感等4个信息抽取任务、13个数据集取得了最先进性能。论文二标题：Pre-training to Match for Unified Low-shot Relation Extraction 作者：Fangchao Liu, Hongyu Lin, Xianpei Han, Boxi Cao, Le Sun 简介：低样本关系抽取旨在少样本甚至零样本场景下的关系抽取。由于低样本关系抽取所包含任务形式多样，传统方法难以统一处理。本文针对这一问题，提出了一种统一的低样本匹配网络：（1）基于语义提示（prompt）范式，我们构造了从关系描述到句子实例的匹配网络模型；（2）针对匹配网络模型学习，我们设计了三元组-复述的预训练方法，以增强模型对关系描述与实例之间语义匹配的泛化性。在零样本、小样本以及带负例的小样本关系抽取评测基准上的实验结果表明，该方法能有效提升低样本场景下关系抽取的性能，并且具备了较好的任务自适应能力。论文三标题: The Invisible Hand: Understanding the Risks of Prompt-based Probing from a Causal View 作者：Boxi Cao, Hongyu Lin, Xianpei Han, Fangchao Liu, Le Sun 简介：基于提示符的探针(prompt-based probing)已经被广泛用于评估预训练模型的能力。然而，已经有诸多研究发现这样的评测范式会存在不准确、不稳定和不可靠等问题。这些探针过程中存在的偏差会使得预训练模型真正的能力无法得到准确的评估，误导我们对预训练模型的理解，甚至产生错误的结论。因此，为了准确评测预训练模型任务的能力，亟需回答三个核心问题：（1）现有基于提示符的探针范式中存在哪些偏差？（2）这些偏差来源于何处？（3）如何消除这些偏差？基于这三个问题，本文：（1）探究和量化了基于提示符的探针中的三种主要偏差，包括提示符偏好偏差(prompt preference bias)、实例语言化偏差(instance verbalization bias)、以及采样差异偏差(sample disparity bias)。（2）提出了一个因果分析框架，可以有效地识别，解释和消除基于提示符探针过程中的偏差。本文为设计无偏的数据集，更好的探针框架，可靠的评估范式，以及推动偏差分析从经验化到理论化(from empirical to theoretical)提供了宝贵的参考价值。论文四标题: Few-shot Named Entity Recognition with Self-describing Networks 作者: Jiawei Chen, Qing Liu, Hongyu [...]

Contact Info

Recent Posts

Monthly Archives: February 2022

中文信息处理实验室5篇长文被ACL 2022录用

Contact Info

Recent Posts