北京大学王选计算机研究所孙薇薇副教授应邀做学术报告
北京大学王选计算机研究所孙薇薇副教授应邀做学术报告 2019年9月17日下午,应实验室孙乐研究员和韩先培研究员邀请,北京大学王选计算机研究所孙薇薇副教授到访实验室,为实验室师生做了题为“English Resource Semantics: Linguistic [...]
中文信息处理实验室多名师生参加CCKS2019
中文信息处理实验室多名师生参加CCKS2019 2019年全国知识图谱与语义计算大会(China Conference on Knowledge [...]
中文信息处理实验室师生参加ACL2019
中文信息处理实验室师生参加ACL2019 ACL(Annual Meeting of the [...]
加拿大蒙特利尔大学聂建云教授、江西师范大学王明文教授与左家莉副教授访问实验室
加拿大蒙特利尔大学聂建云教授、江西师范大学王明文教授与左家莉副教授访问实验室 2019年6月24日上午,应实验室孙乐研究员的邀请,加拿大蒙特利尔大学聂建云教授以及江西师范大学的王明文教授与左家莉副教授访问实验室。 聂建云老师是加拿大蒙特利尔大学教授,他在自然语言处理和信息检索领域深耕多年,主要研究领域包括信息检索模型、跨语言信息检索、Query扩展、Query推荐、Query理解、查询日志利用、情感分析等等。聂建云教授在IR和NLP领域的期刊和国际会议上发表了200多篇论文,他是多个国际期刊的编委(e.g. Journal of [...]
微软亚洲研究院董力博士访问实验室
微软亚洲研究院董力博士访问实验室 2019年6月19日,应实验室孙乐研究员和韩先培研究员邀请,微软亚洲研究院董力博士到访实验室,为实验室师生员工带来了一场题为《UNILM: Unified Language Model [...]
清华大学黄民烈副教授应邀做学术报告
清华大学黄民烈副教授应邀做学术报告 2019年6月6日,应实验室孙乐研究员和韩先培研究员邀请,清华大学计算机系智能技术与系统实验室副主任黄民烈副教授到访实验室,为实验室师生员工带来了一场题为《Controllable text generation: types, [...]
自动化所曾祥荣博士应邀做学术报告
自动化所曾祥荣博士应邀做学术报告 2019年5月31日,应实验室孙乐研究员和韩先培研究员的邀请,中科院自动化所博士毕业生曾祥荣访问实验室,并做了一场题为“面向非结构化文本的关系抽取”的学术报告。 曾祥荣博士首先介绍了关系抽取任务的意义和任务分类,讲解了非结构化文本的关系抽取任务中的难点。随后介绍了在关系抽取任务上的三个工作:第一个工作介绍了如何使用强化学习的思想减轻关系抽取中远距离监督的噪音。第二个和第三个工作利用序列生成模型解决多关系抽取中的实体重叠问题。 报告结束后,曾祥荣博士同与会的师生积极互动,解答大家的学术问题并进行了学术研究方法的交流,会场气氛热烈。 [...]
祝贺实验室林鸿宇、陆垚杰、吴杉3位同学荣获软件所2019年度三好学生
祝贺实验室林鸿宇、陆垚杰、吴杉3位同学荣获软件所2019年度三好学生 根据《中国科学院大学“中国科学院院长奖”评审实施办法》和《中国科学院软件研究所优秀学生评选办法》,经个人申请,实验室培养小组初评和推荐,所评审小组评审,我实验室2017级博士林鸿宇、2018级博士陆垚杰和2017级硕士吴杉获得软件所2019年度“三好学生”荣誉称号。 [...]
实验室四项成果被自然语言处理顶级会议ACL 2019接收
实验室四项成果被自然语言处理顶级会议ACL 2019接收 ACL(Annual Meeting of [...]
天津大学张鹏副教授应邀做学术报告
天津大学张鹏副教授应邀做学术报告 2019年5月17日,应实验室孙乐研究员,韩先培研究员和何苯研究员的邀请,天津大学计算机系张鹏副教授访问实验室,并做了一场题为“A quantum many-body wave [...]
清华大学刘知远副教授应邀做学术报告
清华大学刘知远副教授应邀做学术报告 2019年4月19日,应实验室孙乐研究员和韩先培研究员的邀请,清华大学计算机系刘知远副教授访问实验室,并做了一场题为“知识指导的自然语言处理”的学术报告。 刘知远老师的报告首先概要介绍了自然语言的不同层次理解需要诸如语言知识、常识知识、世界知识等复杂知识的支撑,随后介绍了如何将知网 (Hownet)中的语言知识融入到语义分布式表示学习中;如何利用现有的大规模知识图谱进行知识表示学习,如何利用学习到的知识表示来指导现有的自然语言处理任务;以及如何利用深度学习技术进行知识获取的相关工作。 报告结束后,刘知远老师同与会的师生积极互动,解答大家的学术问题并进行了学术研究方法的交流,会场气氛热烈。 [...]
孙乐研究员参与翻译的《自然语言处理综论》出版
孙乐研究员参与翻译的《自然语言处理综论》出版 孙乐研究员与冯志伟教程合作翻译的《自然语言处理综论》第二版于2018年3月份正式出版。 从本书第一版出版以来,一直好评如潮,被国外许多大学选作自然语言处理或计算语言学的教材,被认为该领域教材的“黄金标准”。本书第一版综合了自然语言处理、计算语言学和语音识别的内容,全面论述计算机自然语言处理,深入探讨计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。该版对于第一版做了全面的改写,增加了大量反映自然语言处理最新成就的内容,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书四大特色: [...]
中文信息处理分工会组织春游活动
春意融融,长城怀古 阳春三月,草长莺飞,正是万物复苏的好时节。3月31日,中文信息处理实验室组织职工及学生40余人共同来到黄花城水长城景区,欣赏美景,放松心情。 黄花城水长城位于北京市怀柔区九渡河镇境内,因三段长城入水而得名,是北京唯一一处长城与水相连的长城。此处融青山、碧水、长城、古树为一体,有“塞外景,江南风,尽在水长城”的美誉。 拾级而上,水长城悠然而立,古朴自然。身处长城之上,漫山野桃花灿烂缤纷,灏明湖碧波粼粼,不时有小船掠过。大家通力合作,一起登上了长城的最高点,在这个过程中既感受到长城承载的厚重历史,也欣赏了自然的美丽风光。微风吹拂中,所有的疲惫都一扫而光。 除了雄伟的长城,归途上形态万千的板栗林,依山蜿蜒的盘山栈道,风景亦是美不胜收。在这样的美景中,大家心情愉悦,一路上欢声笑语,其乐融融。暮色四合,在农家小院的饭菜香味中,大家结束了一天的旅程。 [...]
北京大学冯岩松副教授应邀做学术报告
北京大学冯岩松副教授应邀做学术报告 2019年3月22日下午14:00,应实验室孙乐研究员与韩先培研究员的邀请,北京大学冯岩松副教授来访实验室,为大家带来一场题为“Combining Human Knowledge with [...]
新浪微博张俊林博士应邀来实验室做学术报告
新浪微博张俊林博士应邀来实验室做学术报告 2019年3月1日,应实验室主任孙乐研究员的邀请,新浪微博AI Lab资深算法专家张俊林博士来访实验室,为师生带来一场题为“自然语言预训练技术及RNN/CNN/Transformer比较”的精彩学术报告。现场座无虚席,反响热烈。 张俊林博士首先介绍了NLP中的一些主要预训练技术的技术演进历程,从基础的word embedding技术到近一年来兴起的ELMO、GPT、BERT等语言模型。这些预训练语言模型采用无监督的学习算法,得以利用大规模的自然语言语料进行训练,在各类自然语言处理任务上均取得巨大突破。而作为BERT基础组件的Transformer近年来也得到广泛应用,在各项任务中均取得不少进展。然后,张俊林博士对自然语言处理中的三大特征抽取器Transformer、RNN和CNN的各自优缺点进行了对比分析。最后,张俊林博士又同大家分享了自己对近些年预训练语言模型发展趋势的展望,并详细解答了同学们提出的相关问题。 [...]
中国科学院自动化研究所刘康副研究员应邀做学术报告
中国科学院自动化研究所刘康副研究员应邀做学术报告 2019年1月11日下午14:00,应实验室孙乐研究员与韩先培研究员的邀请,中国科学院自动化研究所刘康副研究员走进中文信息处理实验室,为实验室师生做了关于事件抽取的学术讲座。 刘康博士结合课题组近年来的工作进展, 向大家介绍了从非结构化文本中抽取结构化事件知识的基本方法, 以及应对开放域事件抽取标记数据稀缺的新思路。此外,刘康博士还和大家分享了深度学习方法在金融事件抽取应用项目中的经验和体会。 [...]
复旦大学邱锡鹏老师访问实验室
复旦大学邱锡鹏老师访问实验室 2018年11月9日,应实验室韩先培研究员邀请,复旦大学计算机科学技术学院邱锡鹏老师走进中文信息处理实验室,为师生带来精彩学术报告,中科院软件所和自动化所的同学前来听讲座,现场座无虚席,反响热烈。 邱锡鹏老师以“如何端到端地写科研论文”为题,介绍了如何做科研和写出好的科研论文。老师先讲解了几大顶会的评审制度和审稿标准,然后又从同行评议的数据集出发,通过几种可解释性强的模型,分析了对于论文录用概率有影响的不同的写作方法和写作细节。邱老师又以自己组内ACL-2017的文章《Adversarial Multi-Criteria Learning [...]
中国中文信息学会承办的第53届国际计算语言学年会在北京成功举办
中国中文信息学会承办的第53届国际计算语言学年会在北京成功举办 2015年7月26-31日,由中国中文信息学会承办的第53届国际计算语言学年会(Annual Meeting of the [...]
2018年实验室代表性论文介绍
2018年实验室代表性论文介绍 一、基于区块提议网络的中文事件检测 事件检测则是事件抽取中的一个关键步骤。近年来,随着基于神经网络方法的发展,人们常常将事件检测转化为一个词级别的分类问题来对待。然而,基于词级别分类的事件检测方法没有考虑到事件触发词块与词的不匹配问题。特别是在中文当中,有许多的事件触发词块并不是一个特定的词。 针对上述问题,我们提出了一种基于区块提议网络的中文事件检测方法。具体地,我们的方法首先使用动态多池化卷积神经网络抽取字符级别和词级别的混合特征。之后基于混合特征的触发词块生成器可以在字符级别上直接给出整个触发词块的检测结果,从而避免了事件触发词块与词的不匹配问题。实验结果表明我们的方法在事件检测标准数据集TAC-KBP2017以及ACE2005上取得了State-of-the-Art性能。 上述成果长文发表在自然语言处理顶级国际会议ACL [...]
韩先培获得中国中文信息学会“钱伟长中文信息处理科学技术奖—汉王青年创新奖”一等奖
韩先培获得中国中文信息学会“钱伟长中文信息处理科学技术奖—汉王青年创新奖”一等奖 2016年12月23日,中国中文信息学会第八次全国会员代表大会暨学会成立35周年学术会议在北京隆重举行,会上颁发了“钱伟长中文信息处理科学技术奖”、中国中文信息学会“终身成就奖”、“汉王青年创新奖”以及中国中文信息学会优秀博士学位论文“拓尔思优秀博士学位论文奖”。软件所中文信息处理研究室韩先培副研究员获得“钱伟长中文信息处理科学技术奖—汉王青年创新奖”。 韩先培多年来一直致力于自然语言理解和知识图谱相关的研究工作。自然语言理解是人工智能和自然语言处理的核心科学问题,在研究和应用领域都具有重要的作用。围绕自然语言理解,韩先培在开放域语义知识获取和知识驱动文本语义分析方面取得了多项研究成果。在国际顶级学术会议如ACL、SIGIR、AAAI、EMNLP、CIKM上发表重要论文30余篇,其中在自然语言处理顶级会议ACL上发表论文7篇,相关系统在国际权威评测SIGHAN 2012中文实体链接任务取得第一名的成绩。 韩先培的论文被同行广泛引用,其论文共获得国内外700余次引用,其中引用数超过100次的论文有三篇。特别是,SIGIR [...]