Monthly Archives: November 2019

//November

复旦大学张奇教授应邀做学术报告

2019-11-19T18:00:47+00:00

复旦大学张奇教授应邀做学术报告 2019年11月18日下午,应实验室孙乐研究员和韩先培研究员邀请,复旦大学计算机学院张奇教授到访实验室,为实验室师生作了题为“搜索引擎中的智能问答”的学术报告。 张老师的报告聚焦于近些年在学术界和工业界都备受关注的智能问答方向。张老师首先介绍了近些年搜索引擎发展的趋势,指出了智能问答技术在移动互联网时代的重要性。随即,张老师比较了近些年在学术界火热的SQuAD数据集和工业界实际应用场景下的区别,相比于SQuAD评测,工业界实际场景中存在文档种类更多,质量差异大,文档更长,且不一定存在正确答案等问题,使得真实场景中的智能问答难度更大,更具挑战性。 为了解决智能问答中存在的这些问题,张老师将解决方案分为三大类:1)基于社区的问题回答;2)基于知识图谱的问题回答;3)机器阅读理解。张老师着重介绍了第一和第三这两大类方案的主要方法和最新工作。 基于社区的问题回答,可以当成语义匹配问题来建模。现阶段互联网的问答平台如百度知道、搜狗问问、知乎等都已积累了丰富的问题和答案资源。当用户有新的问题咨询时,可以直接在已有问题中匹配到相似问题,返回对应的已有答案。现有的语义匹配模型可以分为两大类:一是基于句子表示的方法;二是基于交互关系的方法。 在实际问答场景中,许多问题所包含信息较少,但其对应答案中却包含可以解释和区分问题的信息。因此,张老师等在SIGIR2019发表的工作利用自适应多注意力机制,融合答案和问题信息,提高了语义匹配的性能。 尽管基于社区的问题问答在近些年取得了极大的进展,但是依然存在各种精度和召回损失,难以应对社区问答文本中存在的各种情况。因此,引入基于阅读理解的问题问答是十分必要的。 基于阅读理解的问题问答,主要思路是根据所提问题,在文档集中选取相关候选文档,再从候选文档集中抽取出能够回答问题的短语。近些年许多阅读理解模型被提出,如BiDAF、DrQA等。在介绍了阅读理解模型基本框架后,张老师又介绍了近些年的研究进展,如为解决文档中长距离依赖问题,引入了多层级的attention机制的HM-QRNN模型。同时,针对深度学习难解释的问题,张老师等在AAAI2020提出了大规模的中文阅读理解数据集,数据中包含给出答案的依据信息,使得模型在给出答案的同时能够提供对应的依据。除此之外,张老师也介绍了组内最近的开源工具包SMRCToolkit。 最后,张老师总结了智能问答当前面临的一些重要挑战:如何利用知识和常识,如何进行推理,如何快速低成本进行领域切换,如何构造有效的置信度机制等。 报告结束后,张老师与实验室师生进行了热烈的互动,探讨了智能问答的现状,以及工业界当前实际面临的问题。张老师凭借多年来在学术界和工业界的深厚学识和经验,为大家带来了一场生动,具有启发意义的报告,使得大家获益良多。 责任编辑:马龙龙 编辑:刘方超        

复旦大学张奇教授应邀做学术报告 2019-11-19T18:00:47+00:00

中文信息处理实验室师生参加EMNLP-IJCNLP2019

2019-11-18T09:11:30+00:00

中文信息处理实验室师生参加EMNLP-IJCNLP2019 2019年11月3日至7日,由ACL SIGDAT(语言学数据特殊兴趣小组)主办的EMNLP-IJCNLP 2019(2019 Conference on Empirical Methods in Natural Language Processing and 9th International Joint Conference on Natural Language Processing)在中国香港成功举行。中国科学院软件研究所中文信息处理实验室孙乐研究员、安波副研究员以及博士生林鸿宇、颜令勇参加了本次会议。 EMNLP是自然语言处理领域的顶级国际会议,覆盖了语言分析、信息抽取、信息检索、自动问答、情感分析和观点挖掘、文摘和文本生成、文本分类和挖掘、机器翻译、语义解析等众多研究方向。   参会师生合影 本次会议共收到2876篇投稿,接收论文683篇,接受率23.7%。实验室共有三项工作被会议录用,包括: 1) GEANN: Gazetteer-Enhanced Attentive Neural Networks for Named Entity Recognition,作者包括林鸿宇、陆垚杰、韩先培、孙乐等,探讨命名实体识别问题。 2) Learning to Bootstrap for Entity Set Expansion,作者包括颜令勇、韩先培、孙乐、何苯,提出了一种用于有效实体集扩展算法。 3) EUSP: An Easy-to-Use Semantic Parsing PlatForm,作者包括安波、陈波、韩先培、孙乐,提出了一种自然语言解析平台。 11月3日晚间,孙乐研究员受邀出席有华为公司主办的“HUAWEI Night-EMNLP 2019”活动并发表了精彩的演讲,本次活动其他受邀发表演讲的嘉宾还有爱丁堡大学信息学院教授、ACL终身成就奖获得者Mark Steedman以及,香港中文大学黄锦辉教授。 孙乐研究员在“华为之夜”发表演讲 孙乐研究员与Mark Steedman教授、黄锦辉教授合影 在本次ACL会议上,参会的师生就上述被录用论文做了海报报告和系统演示,并与自然语言处理领域的国内外研究人员进行了深入的交流。 博士生林鸿宇做Poster报告 博士生颜令勇做Poster报告 安波做系统展示报告 责任编辑:马龙龙 编辑:安波      

中文信息处理实验室师生参加EMNLP-IJCNLP2019 2019-11-18T09:11:30+00:00

祝贺实验室唐家龙和吴杉荣获2019年国家奖学金

2019-11-08T11:01:41+00:00

祝贺实验室唐家龙和吴杉荣获2019年国家奖学金 所研究生国家奖学金评审委员会于2019年11月6日组织了公开答辩、评议,最后通过无记名投票表决,我实验室2018级直博生唐家龙同学、2017级硕士吴杉同学获得2019年硕士研究生国家奖学金。特向两位同学表示祝贺!      

祝贺实验室唐家龙和吴杉荣获2019年国家奖学金 2019-11-08T11:01:41+00:00