Monthly Archives: December 2020

//December

厦门大学苏劲松教授应邀到访中文信息处理实验室并作学术报告

2020-12-29T16:38:12+00:00

厦门大学苏劲松教授应邀到访中文信息处理实验室并作学术报告 2020年12月28日下午,应实验室孙乐研究员和韩先培研究员的邀请,厦门大学苏劲松教授到访实验室,为实验室师生做了题为“神经机器翻译领域自适应研究”的学术报告。 苏劲松老师现任厦门大学信息学院软件工程系教授,博士生导师。主要研究方向是自然语言处理、社会计算,共发表学术论文100余篇,包括CCF推荐列表论文68篇。 近年来,低资源神经机器翻译(NMT)受到广泛关注,多领域神经机器翻译可以利用多个领域平行语料来构造一个统一的模型从而解决领域内数据稀少的问题。 为了同时利用和共享多种领域的翻译数据构建多领域NMT,苏老师课题组提出了区分词粒度上下文的多领域神经机器翻译模型。该方法将词级别隐状态区分为领域相关和领域共享的隐状态,并根据目标词与不同领域的相关性,调整目标词在NMT训练目标中的权重。模型在大规模多领域汉英和英法语数据集上验证性能均有所提升。 用于神经机器翻译的领域适应研究集中在领域外向领域内的一次迁移训练方式,然而由于领域间的差异这样one-pass训练方式很难达到目标,为此苏老师课题组提出了迭代双向迁移的神经机器翻译训练框架。这样迭代多源知识互转移框架在机器阅读理解中也验证了其有效性。 苏老师从机器翻译的领域迁移出发,介绍了课题组的研究工作和后续的研究进展,并对未来的神经机器翻译和领域知识蒸馏研究进行总结和展望。报告结束后,苏劲松老师与实验室师生就论文细节和科研经验展开了热烈讨论。 撰稿:吴杉 责任编辑:刘汇丹

厦门大学苏劲松教授应邀到访中文信息处理实验室并作学术报告 2020-12-29T16:38:12+00:00

中文信息处理实验室两篇论文被AAAI2021录用

2020-12-09T12:18:45+00:00

中文信息处理实验室两篇论文被AAAI2021录用 日前,2021年的首个人工智能顶级会议 AAAI 2021公布了论文录用列表,中国科学院软件研究所中文信息处理实验室两篇长文被大会录用。 下面是论文列表及介绍:   论文一 题目:Denoising distantly supervised named entity recognition via a hypergeometric probabilistic model 作者:张文凯、林鸿宇、韩先培、孙乐、刘汇丹、袁晶、魏志成 录用类型:长文 简介:远程监督命名实体识别缓解了深度学习模型对大量标注数据的依赖,但性能却受到远程监督数据中噪声的影响。为此,我们提出了一种基于超几何分布的远程监督数据降噪算法HyperGeometric Learning(HGL)。HGL利用超几何分布和模型训练过程的相似性,能够在训练过程中自适应的对噪声数据分布进行拟合,在ACE2005数据集上取得较好的降噪效果。   论文二 题目:Benchmarking Knowledge-enhanced Commonsense Question Answering via Knowledge-to-Text Transformation 作者:边宁,韩先培,陈波,孙乐 录用类型:长文 简介:提出了一个简洁而有效的基于知识到文本转换的常识问答模型框架,在多个标准的常识问答数据集上进行了深入的测试和分析,并为知识增强的常识问答提供了高性能的基准模型。实验显示:①基于知识到文本转换的常识问答模型是有效且鲁棒的;②融合外部知识对于常识问答任务依然有较大潜力;③目前的常识问答模型还远不能充分发挥知识的潜力——与使用标准知识解释的模型相比,现有模型均有较大性能差距。 据悉, AAAI 2021 将于美国纽约举办,时间在 2021年2 月 2 日至 9 日,本届是第 35 届 AAAI 大会。AAAI 由美国人工智能协会主办,该协会是人工智能领域的主要学术组织之一,其主办的年会也是人工智能领域的国际顶级会议。在中国计算机学会的国际学术会议排名以及清华大学新发布的计算机科学推荐学术会议和期刊列表中,AAAI 均被列为人工智能领域的 A 类顶级会议。AAAI 2021官方发布接收论文列表,9034篇论文提交有1692篇论文接受,接受率21%。 撰稿:刘汇丹 责任编辑:刘汇丹

中文信息处理实验室两篇论文被AAAI2021录用 2020-12-09T12:18:45+00:00