北京市自然科学基金-小米联合基金重点项目开题及进展研讨会顺利召开
北京市自然科学基金-小米联合基金重点项目开题及进展研讨会顺利召开 2024年12月17日,北京市自然科学基金-小米联合基金重点项目“大语言模型知识的表征、学习、记忆和注入机制分析与验证”开题及进展研讨会在中国科学院软件研究所顺利举行。 研讨会特邀北京理工大学教授黄河燕、小米集团研究员王斌、北京理工大学教授邬霞、中国科学院信息工程研究所研究员陈恺和中国人民大学教授赵鑫、小米公益基金会副秘书长高文隽、小米大模型负责人栾剑、小米技术委技术合作高级经理丁倩到会指导,中国科学院软件研究所科技处处长王熙博及项目组成员出席本次会议。 中国科学院软件研究所科技处处长王熙博对与会的专家表示热烈欢迎,感谢他们年末百忙之中莅临指导。 项目负责人孙乐研究员汇报了项目的整体情况及进展,从科学问题与研究目标、研究内容与技术方案、预期成果与考核指标以及总体进展与工作计划等多个方面进行汇报。接着,各课题负责人依次汇报了课题的研究内容、进展和技术方案。各位课题负责人深入介绍了项目在知识探测、知识体系化评估和大模型优化等方面的技术挑战与创新方案。专家组成员深入讨论了项目的整体技术方案和研究方向,并对知识表征、学习、记忆及注入机制等关键技术难点进行了充分质询。专家组一致认为,项目研究目标明确,团队基础良好,期待研究成果能够在大模型知识机制理论、方法和实践中产生重要影响。 [...]
中文信息处理实验室多篇论文被 AAAI 与 COLING 录用
中文信息处理实验室多篇论文被 AAAI 与 COLING 录用 [...]
中文信息处理实验室多篇论文被NeurIPS 与 EMNLP 录用
中文信息处理实验室多篇论文被NeurIPS 与 EMNLP 录用 近日,中文信息处理实验室多项大模型领域研究成果被国际顶级会议 [...]
爱丁堡大学Jeff Z. Pan教授应邀为实验室进行学术报告
爱丁堡大学Jeff Z. Pan教授应邀为实验室进行学术报告 9月25日上午,应实验室孙乐研究员的邀请,爱丁堡大学终身讲席教授、华为爱丁堡知识图谱实验室主任Jeff Z. [...]
中文信息处理实验室12篇论文被ACL2024录用
中文信息处理实验室12篇论文被ACL2024录用 近日,中文信息处理实验室12 项大模型领域研究成果被国际顶级会议ACL2024录用,相关成果涉及大模型知识机制、大模型价值观对齐、大模型智能规划、大模型评估、大模型检索等方向。以下是相关被录用成果的简要介绍。 成果一:沉默的螺旋:大模型如何影响信息检索? [...]
中文信息处理实验室2025届推免招生说明 — 欢迎加入中文信息处理实验室!
中文信息处理实验室推免招生说明 各位同学好,非常感谢各位同学考虑报考中科院软件所中文信息处理实验室。由于每年报考实验室的同学有一些相似的问题想要了解,因此实验室撰写了如下招生说明,供各位有意报考实验室的同学查阅。 一、实验室简介 中科院软件所中文信息处理实验室实始于1996年成立的“开放系统与中文信息处理中心”。实验室长期致力于大模型、自然语言理解、信息抽取与信息检索等领域前沿技术的研究与开发。目前,实验室共有博士生导师3人、硕士生导师5人,在读研究生30余人。 实验室目前承担着中科院先导A类项目、国家重大研发计划、国家自然科学基金重点项目、国家自然科学基金优青项目等重要国家科研课题,并与阿里、腾讯、字节、百度、华为、小米、美团等知名互联网企业建立有广泛的研发合作。近年来,实验室已经在ACL、SIGIR、AAAI、IJCAI、EMNLP、AIJ等自然语言处理与信息检索领域国际顶级会议和期刊上发表论文百余篇,并曾在TREC、NTCIR、DUC、TAC等信息检索和自然语言处理领域的权威国际评测中多次取得优异成绩。 [...]
中央财经大学迟钰雪副教授应邀为实验室进行学术报告
中央财经大学迟钰雪副教授应邀为实验室进行学术报告 2024年4月2日下午,应实验室林鸿宇副研究员的邀请,中央财经大学管理科学与工程学院副教授迟钰雪老师为实验室进行了题为 "Risk spillovers in Chinese production network: A supply-side shock perspective" 的学术报告。 迟钰雪老师是中央财经大学管理科学与工程学院副教授,中国发展战略学研究会社会战略专业委员会委员。主持国家自然科学基金青年基金1项,参与多项国家自然科学基金面上项目、重大研究项目及国家高端智库试点项目。近年来,在《Nature Humanities and Social Sciences Communications,Knowledge-Based Systems》,《Information Processing & Management》,《管理科学学报》,《系统工程理论与实践》等期刊发表论文十余篇。长期担任《Information Sciences》、《系统工程理论与实践》等期刊审稿人。 [...]
大模型遇见社会科学:从“人的社会”到“AI的社会” 的研究
大模型遇见社会科学:从“人的社会”到“AI的社会” 的研究 论文标题:AI for Social [...]
学习还是自我对齐 ? 关于指令微调的内在机制的探究
学习还是自我对齐 ? 关于指令微调的内在机制的探究 论文标题:Learning or [...]
上海交通大学张倬胜博士应邀至实验室进行学术报告
上海交通大学张倬胜博士应邀至实验室进行学术报告 2024年1月26日上午,上海交通大学张倬胜博士应邀在中文信息处理实验室发表了题为《大模型自主智能体的应用及安全挑战》的专题报告。 张倬胜博士是上海交通大学电子信息与电气工程学院长聘教轨助理教授,曾担任领域内重要会议LREC-COLING 2024领域主席、ICLR 2023 Tiny Papers领域主席和中国计算语言学大会CCL 2022分委会主席。入选中国中文信息学会博士学位论文激励计划,获评2023世界人工智能大会云帆奖明日之星、全球 AI 华人百强学术新星。主要研究方向为预训练语言模型、自主智能体及其安全。在TPAMI、ICLR、ACL、AAAI等顶级学术期刊/会议发表论文50余篇。Google Scholar论文被引用次数超过3000次,3篇第一作者论文入选为AAAI和COLING高影响力论文列表。研发的语言理解与推理系统在8项国际权威自然语言理解评测获得第一名。 报告中,张倬胜博士从智能机器人的未来应用畅想切入,讲述了大模型自主智能体的概念,并介绍了其具有自主性、自适应性、动态响应和自我完善等特性,以及其在现实与虚拟世界中包括系统操控、软件开发、科学发现、具身智能在内的各类场景中的应用。接着,他以Auto-UI智能手机自主智能体为例,展示了大模型自主智能体的具体应用实例,并以此工作中发现的攻击现象为引,引出了有关智能体强大能力背后潜在的安全挑战的讨论。 随后,张倬胜博士从智能体应用的流程与形式等方面具体分析了其安全风险分类和来源的复杂性,智能体本身产生的内容与行为均存在风险,同时智能体系统在用户侧、模型侧和环境侧均存在潜在的漏洞以及被攻击的风险。张倬胜博士展示了他和团队提出的“R-Judge大模型智能体行为安全评测”,旨在探测模型自身安全风险判断能力与基于外界安全反馈的判断能力上限。他们发现模型对安全风险的判断与人类表现存在较大差距,模型越大性能越好,风险描述与环境反馈是提升模型检测风险能力的有效手段,并且指令遵循能力直接影响模型性能表现。 [...]
计算所沈华伟老师应邀为实验室进行学术报告
计算所沈华伟老师应邀为实验室进行学术报告 2024 年 1 月 [...]
北京师范大学邬霞教授在实验室进行学术报告
北京师范大学邬霞教授在实验室进行学术报告 2023年12月28日上午,北京师范大学邬霞教授在中文信息处理实验室应邀发表了题为《类脑视觉智能:原理与方法》的专题报告。 邬霞老师是北京师范大学人工智能学院教授、博士生导师,CCF高级会员,国家自然科学基金杰出青年和优秀青年基金、吴文俊人工智能自然科学一等奖、教育部自然科学二等奖、茅以升北京青年科技奖获得者。主要研究方向为脑信号智能分析、类脑算法等。近年来,主持承担国家自然科学基金重点项目、国家重点研发计划等项目十余项,以第一/通讯作者在IEEE TNNLS、IEEE TKDE、IEEE TAC、NeuroImage、Medical Image Analysis、JBHI、IPMI、MICCAI等国内外重要学术期刊/会议发表论文100余篇。 [...]
加拿大蒙特利尔大学聂建云老师应邀为实验室进行学术报告
加拿大蒙特利尔大学聂建云老师应邀为实验室进行学术报告 2023年8月15日上午,应实验室孙乐研究员的邀请,加拿大蒙特利尔大学教授聂建云老师为实验室进行了题为 “Leveraging Conversation Context [...]
中文信息处理实验室2023推免招生说明 — 欢迎加入中文信息处理实验室!
中文信息处理实验室推免招生说明 各位同学好,非常感谢各位同学考虑报考中科院软件所中文信息处理实验室。由于每年报考实验室的同学有一些相似的问题想要了解,因此实验室撰写了如下招生说明,供各位有意报考实验室的同学查阅。 重点:2023年软件所夏令营已经开启报名,报名截止日期为2023年7月1日。请有意报考实验室的同学尽量参加软件所举办的“软件与网络“夏令营。 一、实验室简介 [...]
大模型的思想钢印:如何让ChatGPT相信水是有毒的?中文信息处理实验室最新研究揭示虚假信息在大模型中的扩散机制
大模型的思想钢印:如何让ChatGPT相信水是有毒的? 中文信息处理实验室最新研究揭示虚假信息在大模型中的扩散机制 “你真的认为水有毒?”希恩斯问。 “这有什么可怀疑的吗?就像太阳有光和空气中有氧一样,你们不至于否认这个常识吧。” 希恩斯扶着他的肩膀说:“年轻人,生命在水中产生并且离不开水,你现在的身体中百分之七十是水。” [...]
中文信息处理实验室6篇论文被ACL及SIGIR录用
中文信息处理实验室6篇论文被ACL及SIGIR录用 近日,自然语言处理国际顶级会议ACL2023和信息检索领域国际顶级会议SIGIR 2023录用结果出炉,中国科学院软件研究所中文信息处理实验室有多篇论文被录用: ACL 论文一 [...]
长城水韵,共赏春色——记中文信息处理实验室春游
长城水韵,共赏春色——记中文信息处理实验室春游 古人云:“登山则情满于山,观海则意溢于海。”2023年4月1日,中文信息处理实验室职工及学生20余人齐聚北京市怀柔区黄花城水长城旅游区,欣赏春日美景,共度愉快的团建时光。 黄花城水长城距离北京市区65公里,以山川、碧水、古长城相融的美景著称。这里的三绝景更是令人陶醉。首先是明永乐年间修建的长城,盘旋在山脊之上,环绕在灏明湖畔,景色既秀美又壮观;其次是湖水将长城自然断开,形成独特的长城戏水、水没长城景观;最后是明代板栗园,古树盘根错节,各具特色,让人叹为观止。 实验室的一行人沿着古道,穿越木桥,跨过小溪,攀登怪石,共同感受着攀登险峻长城的挑战与乐趣。途中,龙尾洞、紫翠峰、醉女山、石浪谷、情人峰、三珠连潭等自然景观令人心旷神怡,流连忘返。春日里,山桃花淡粉浅白,漫山遍野,给古老的长城带来了一丝灵秀气息。 登顶长城后,大家在山顶欣赏远处湖波荡漾的美景,感受着这座古老城墙与自然水域相融的奇妙景象。休息时,大家围坐在一起,分享美食、畅谈心情,增进了团队之间的友谊与默契。 [...]
复旦大学桂韬老师应邀为实验室进行学术报告
复旦大学桂韬老师应邀为实验室进行学术报告 2023年3月23日下午,应实验室林鸿宇副研究员的邀请,复旦大学自然语言处理实验室副研究员桂韬老师为实验室进行了题为 “ChatGPT的能力分析与鲁棒性探索”的学术报告。 桂韬,复旦大学自然语言处理实验室副研究员、硕士生导师。研究领域为预训练模型、信息抽取和鲁棒模型。在高水平国际学术期刊和会议上发表了40余篇论文,主持国家自然科学基金、计算机学会、人工智能学会多个基金项目。曾获钱伟长中文信息处理科学技术奖一等奖(2/5)、中国中文信息学会优秀博士论文奖、COLING2018最佳论文提名奖、NLPCC2019亮点论文奖,入选第七届“中国科协青年人才托举工程”、上海市启明星计划。 桂韬老师为大家介绍了他们在ChatGPT的能力与鲁棒性探究的相关工作,主要包括ChatGPT来源、ChatGPT各种相关能力的测试。具体地,桂韬老师详细地介绍了过去NLP领域的发展历史以及 [...]
清华大学侯磊老师应邀为实验室进行学术报告
2022年10月25日上午,应实验室孙乐研究员和韩先培研究员的邀请,清华大学计算机系助理研究员侯磊老师为实验室进行了题为 “Explainable Knowledge Reasoning for [...]
中文信息处理实验室陆垚杰博士、孙乐研究员分别荣获中国科学院院长特别奖、优秀导师奖
中文信息处理实验室陆垚杰博士、孙乐研究员分别荣获中国科学院院长特别奖、优秀导师奖 近日,中国科学院公布了2022年度“中国科学院院长奖”评审结果,中国科学院软件研究所中文信息处理实验室2016级硕博连读生陆垚杰荣获“中国科学院院长特别奖”,其指导教师孙乐研究员荣获“中国科学院优秀导师奖”。 陆垚杰,2016年进入软件所学习,2018年转为博士生,主要从事自然语言处理方向的研究。他曾参与国家自然科学基金重点项目等重大国家科研任务以及百度、腾讯等国内外知名企业科技研发任务。陆垚杰与合作者一起,在人工智能、自然语言处理领域国际顶级期刊和会议AIJ、AAAI以及ACL上发表学术论文十余篇,论文被美国宾州大学、哈佛大学、谷歌等国内外知名高校、企业的学者引用。在信息抽取领域,他提出了一套全新的通用信息抽取结构生成新架构,并在多个信息抽取任务上给出了当前国际上最好的结果。在事件抽取领域,他提出的结构可控生成方法作为该领域的重要方法之一,被该领域相关综述以及国际知名课程多次引用。在学期间,陆垚杰还获得了研究生“国家奖学金”、中国科学院大学“三好学生”等荣誉称号。 “中国科学院院长奖学金”设立于1989年,每年评选一次。2022年全院共80人获“中国科学院院长特别奖”,400人获“中国科学院院长优秀奖”。