研究室动态

304, 2025

中科院软件所中文信息处理实验室获EDBT最佳论文奖亚军

中科院软件所中文信息处理实验室获EDBT最佳论文奖亚军近日，数据库领域重要国际学术会议 EDBT 2025（The 28th [...]

2012, 2024

北京市自然科学基金-小米联合基金重点项目开题及进展研讨会顺利召开

北京市自然科学基金-小米联合基金重点项目开题及进展研讨会顺利召开 2024年12月17日，北京市自然科学基金-小米联合基金重点项目“大语言模型知识的表征、学习、记忆和注入机制分析与验证”开题及进展研讨会在中国科学院软件研究所顺利举行。研讨会特邀北京理工大学教授黄河燕、小米集团研究员王斌、北京理工大学教授邬霞、中国科学院信息工程研究所研究员陈恺和中国人民大学教授赵鑫、小米公益基金会副秘书长高文隽、小米大模型负责人栾剑、小米技术委技术合作高级经理丁倩到会指导，中国科学院软件研究所科技处处长王熙博及项目组成员出席本次会议。中国科学院软件研究所科技处处长王熙博对与会的专家表示热烈欢迎，感谢他们年末百忙之中莅临指导。项目负责人孙乐研究员汇报了项目的整体情况及进展，从科学问题与研究目标、研究内容与技术方案、预期成果与考核指标以及总体进展与工作计划等多个方面进行汇报。接着，各课题负责人依次汇报了课题的研究内容、进展和技术方案。各位课题负责人深入介绍了项目在知识探测、知识体系化评估和大模型优化等方面的技术挑战与创新方案。专家组成员深入讨论了项目的整体技术方案和研究方向，并对知识表征、学习、记忆及注入机制等关键技术难点进行了充分质询。专家组一致认为，项目研究目标明确，团队基础良好，期待研究成果能够在大模型知识机制理论、方法和实践中产生重要影响。 [...]

1712, 2024

中文信息处理实验室多篇论文被 AAAI 与 COLING 录用

中文信息处理实验室多篇论文被 AAAI 与 COLING 录用 [...]

810, 2024

中文信息处理实验室多篇论文被NeurIPS 与 EMNLP 录用

中文信息处理实验室多篇论文被NeurIPS 与 EMNLP 录用近日，中文信息处理实验室多项大模型领域研究成果被国际顶级会议 [...]

410, 2024

爱丁堡大学Jeff Z. Pan教授应邀为实验室进行学术报告

爱丁堡大学Jeff Z. Pan教授应邀为实验室进行学术报告 9月25日上午，应实验室孙乐研究员的邀请，爱丁堡大学终身讲席教授、华为爱丁堡知识图谱实验室主任Jeff Z. [...]

2405, 2024

中文信息处理实验室12篇论文被ACL2024录用

中文信息处理实验室12篇论文被ACL2024录用近日，中文信息处理实验室12 项大模型领域研究成果被国际顶级会议ACL2024录用，相关成果涉及大模型知识机制、大模型价值观对齐、大模型智能规划、大模型评估、大模型检索等方向。以下是相关被录用成果的简要介绍。成果一：沉默的螺旋：大模型如何影响信息检索？ [...]

2804, 2024

中文信息处理实验室2025届推免招生说明 — 欢迎加入中文信息处理实验室！

中文信息处理实验室推免招生说明各位同学好，非常感谢各位同学考虑报考中科院软件所中文信息处理实验室。由于每年报考实验室的同学有一些相似的问题想要了解，因此实验室撰写了如下招生说明，供各位有意报考实验室的同学查阅。一、实验室简介中科院软件所中文信息处理实验室实始于1996年成立的“开放系统与中文信息处理中心”。实验室长期致力于大模型、自然语言理解、信息抽取与信息检索等领域前沿技术的研究与开发。目前，实验室共有博士生导师3人、硕士生导师5人，在读研究生30余人。实验室目前承担着中科院先导A类项目、国家重大研发计划、国家自然科学基金重点项目、国家自然科学基金优青项目等重要国家科研课题，并与阿里、腾讯、字节、百度、华为、小米、美团等知名互联网企业建立有广泛的研发合作。近年来，实验室已经在ACL、SIGIR、AAAI、IJCAI、EMNLP、AIJ等自然语言处理与信息检索领域国际顶级会议和期刊上发表论文百余篇，并曾在TREC、NTCIR、DUC、TAC等信息检索和自然语言处理领域的权威国际评测中多次取得优异成绩。 [...]

1504, 2024

中央财经大学迟钰雪副教授应邀为实验室进行学术报告

中央财经大学迟钰雪副教授应邀为实验室进行学术报告 2024年4月2日下午，应实验室林鸿宇副研究员的邀请，中央财经大学管理科学与工程学院副教授迟钰雪老师为实验室进行了题为 "Risk spillovers in Chinese production network: A supply-side shock perspective" 的学术报告。迟钰雪老师是中央财经大学管理科学与工程学院副教授，中国发展战略学研究会社会战略专业委员会委员。主持国家自然科学基金青年基金1项，参与多项国家自然科学基金面上项目、重大研究项目及国家高端智库试点项目。近年来，在《Nature Humanities and Social Sciences Communications，Knowledge-Based Systems》，《Information Processing & Management》，《管理科学学报》，《系统工程理论与实践》等期刊发表论文十余篇。长期担任《Information Sciences》、《系统工程理论与实践》等期刊审稿人。 [...]

1603, 2024

大模型遇见社会科学：从“人的社会”到“AI的社会” 的研究

大模型遇见社会科学：从“人的社会”到“AI的社会” 的研究论文标题：AI for Social [...]

203, 2024

学习还是自我对齐 ? 关于指令微调的内在机制的探究

学习还是自我对齐 ? 关于指令微调的内在机制的探究论文标题：Learning or [...]

2601, 2024

上海交通大学张倬胜博士应邀至实验室进行学术报告

上海交通大学张倬胜博士应邀至实验室进行学术报告 2024年1月26日上午，上海交通大学张倬胜博士应邀在中文信息处理实验室发表了题为《大模型自主智能体的应用及安全挑战》的专题报告。张倬胜博士是上海交通大学电子信息与电气工程学院长聘教轨助理教授，曾担任领域内重要会议LREC-COLING 2024领域主席、ICLR 2023 Tiny Papers领域主席和中国计算语言学大会CCL 2022分委会主席。入选中国中文信息学会博士学位论文激励计划，获评2023世界人工智能大会云帆奖明日之星、全球 AI 华人百强学术新星。主要研究方向为预训练语言模型、自主智能体及其安全。在TPAMI、ICLR、ACL、AAAI等顶级学术期刊/会议发表论文50余篇。Google Scholar论文被引用次数超过3000次，3篇第一作者论文入选为AAAI和COLING高影响力论文列表。研发的语言理解与推理系统在8项国际权威自然语言理解评测获得第一名。报告中，张倬胜博士从智能机器人的未来应用畅想切入，讲述了大模型自主智能体的概念，并介绍了其具有自主性、自适应性、动态响应和自我完善等特性，以及其在现实与虚拟世界中包括系统操控、软件开发、科学发现、具身智能在内的各类场景中的应用。接着，他以Auto-UI智能手机自主智能体为例，展示了大模型自主智能体的具体应用实例，并以此工作中发现的攻击现象为引，引出了有关智能体强大能力背后潜在的安全挑战的讨论。随后，张倬胜博士从智能体应用的流程与形式等方面具体分析了其安全风险分类和来源的复杂性，智能体本身产生的内容与行为均存在风险，同时智能体系统在用户侧、模型侧和环境侧均存在潜在的漏洞以及被攻击的风险。张倬胜博士展示了他和团队提出的“R-Judge大模型智能体行为安全评测”，旨在探测模型自身安全风险判断能力与基于外界安全反馈的判断能力上限。他们发现模型对安全风险的判断与人类表现存在较大差距，模型越大性能越好，风险描述与环境反馈是提升模型检测风险能力的有效手段，并且指令遵循能力直接影响模型性能表现。 [...]

2401, 2024

计算所沈华伟老师应邀为实验室进行学术报告

计算所沈华伟老师应邀为实验室进行学术报告 2024 年 1 月 [...]

2401, 2024

北京师范大学邬霞教授在实验室进行学术报告

北京师范大学邬霞教授在实验室进行学术报告 2023年12月28日上午，北京师范大学邬霞教授在中文信息处理实验室应邀发表了题为《类脑视觉智能：原理与方法》的专题报告。邬霞老师是北京师范大学人工智能学院教授、博士生导师，CCF高级会员，国家自然科学基金杰出青年和优秀青年基金、吴文俊人工智能自然科学一等奖、教育部自然科学二等奖、茅以升北京青年科技奖获得者。主要研究方向为脑信号智能分析、类脑算法等。近年来，主持承担国家自然科学基金重点项目、国家重点研发计划等项目十余项，以第一/通讯作者在IEEE TNNLS、IEEE TKDE、IEEE TAC、NeuroImage、Medical Image Analysis、JBHI、IPMI、MICCAI等国内外重要学术期刊/会议发表论文100余篇。 [...]

1808, 2023

加拿大蒙特利尔大学聂建云老师应邀为实验室进行学术报告

加拿大蒙特利尔大学聂建云老师应邀为实验室进行学术报告 2023年8月15日上午，应实验室孙乐研究员的邀请，加拿大蒙特利尔大学教授聂建云老师为实验室进行了题为 “Leveraging Conversation Context [...]

606, 2023

中文信息处理实验室2023推免招生说明 — 欢迎加入中文信息处理实验室！

中文信息处理实验室推免招生说明各位同学好，非常感谢各位同学考虑报考中科院软件所中文信息处理实验室。由于每年报考实验室的同学有一些相似的问题想要了解，因此实验室撰写了如下招生说明，供各位有意报考实验室的同学查阅。重点：2023年软件所夏令营已经开启报名，报名截止日期为2023年7月1日。请有意报考实验室的同学尽量参加软件所举办的“软件与网络“夏令营。一、实验室简介 [...]

2505, 2023

大模型的思想钢印：如何让ChatGPT相信水是有毒的？中文信息处理实验室最新研究揭示虚假信息在大模型中的扩散机制

大模型的思想钢印：如何让ChatGPT相信水是有毒的？中文信息处理实验室最新研究揭示虚假信息在大模型中的扩散机制 “你真的认为水有毒？”希恩斯问。 “这有什么可怀疑的吗？就像太阳有光和空气中有氧一样，你们不至于否认这个常识吧。” 希恩斯扶着他的肩膀说：“年轻人，生命在水中产生并且离不开水，你现在的身体中百分之七十是水。” [...]

1905, 2023

中文信息处理实验室6篇论文被ACL及SIGIR录用

中文信息处理实验室6篇论文被ACL及SIGIR录用近日，自然语言处理国际顶级会议ACL2023和信息检索领域国际顶级会议SIGIR 2023录用结果出炉，中国科学院软件研究所中文信息处理实验室有多篇论文被录用： ACL 论文一 [...]

304, 2023

长城水韵，共赏春色——记中文信息处理实验室春游

长城水韵，共赏春色——记中文信息处理实验室春游古人云：“登山则情满于山，观海则意溢于海。”2023年4月1日，中文信息处理实验室职工及学生20余人齐聚北京市怀柔区黄花城水长城旅游区，欣赏春日美景，共度愉快的团建时光。黄花城水长城距离北京市区65公里，以山川、碧水、古长城相融的美景著称。这里的三绝景更是令人陶醉。首先是明永乐年间修建的长城，盘旋在山脊之上，环绕在灏明湖畔，景色既秀美又壮观；其次是湖水将长城自然断开，形成独特的长城戏水、水没长城景观；最后是明代板栗园，古树盘根错节，各具特色，让人叹为观止。实验室的一行人沿着古道，穿越木桥，跨过小溪，攀登怪石，共同感受着攀登险峻长城的挑战与乐趣。途中，龙尾洞、紫翠峰、醉女山、石浪谷、情人峰、三珠连潭等自然景观令人心旷神怡，流连忘返。春日里，山桃花淡粉浅白，漫山遍野，给古老的长城带来了一丝灵秀气息。登顶长城后，大家在山顶欣赏远处湖波荡漾的美景，感受着这座古老城墙与自然水域相融的奇妙景象。休息时，大家围坐在一起，分享美食、畅谈心情，增进了团队之间的友谊与默契。 [...]

2303, 2023

复旦大学桂韬老师应邀为实验室进行学术报告

复旦大学桂韬老师应邀为实验室进行学术报告 2023年3月23日下午，应实验室林鸿宇副研究员的邀请，复旦大学自然语言处理实验室副研究员桂韬老师为实验室进行了题为 “ChatGPT的能力分析与鲁棒性探索”的学术报告。桂韬，复旦大学自然语言处理实验室副研究员、硕士生导师。研究领域为预训练模型、信息抽取和鲁棒模型。在高水平国际学术期刊和会议上发表了40余篇论文，主持国家自然科学基金、计算机学会、人工智能学会多个基金项目。曾获钱伟长中文信息处理科学技术奖一等奖（2/5）、中国中文信息学会优秀博士论文奖、COLING2018最佳论文提名奖、NLPCC2019亮点论文奖，入选第七届“中国科协青年人才托举工程”、上海市启明星计划。桂韬老师为大家介绍了他们在ChatGPT的能力与鲁棒性探究的相关工作，主要包括ChatGPT来源、ChatGPT各种相关能力的测试。具体地，桂韬老师详细地介绍了过去NLP领域的发展历史以及 [...]

2610, 2022

清华大学侯磊老师应邀为实验室进行学术报告

2022年10月25日上午，应实验室孙乐研究员和韩先培研究员的邀请，清华大学计算机系助理研究员侯磊老师为实验室进行了题为 “Explainable Knowledge Reasoning for [...]

12 Next

21,797