复旦大学桂韬老师应邀为实验室进行学术报告
2023年3月23日下午,应实验室林鸿宇副研究员的邀请,复旦大学自然语言处理实验室副研究员桂韬老师为实验室进行了题为 “ChatGPT的能力分析与鲁棒性探索”的学术报告。
桂韬,复旦大学自然语言处理实验室副研究员、硕士生导师。研究领域为预训练模型、信息抽取和鲁棒模型。在高水平国际学术期刊和会议上发表了40余篇论文,主持国家自然科学基金、计算机学会、人工智能学会多个基金项目。曾获钱伟长中文信息处理科学技术奖一等奖(2/5)、中国中文信息学会优秀博士论文奖、COLING2018最佳论文提名奖、NLPCC2019亮点论文奖,入选第七届“中国科协青年人才托举工程”、上海市启明星计划。
桂韬老师为大家介绍了他们在ChatGPT的能力与鲁棒性探究的相关工作,主要包括ChatGPT来源、ChatGPT各种相关能力的测试。具体地,桂韬老师详细地介绍了过去NLP领域的发展历史以及 OpenAI的 GPT系列进化路径,指出了当前大规模语言模型的三个重要能力:情景学习(in-context learning)、思维链(chain-of-thought)和指令学习(Instruction leraning)。随后,桂韬老师介绍了它们在各类NLP任务上对GPT3系列模型的评测,发现了随着GPT系列模型不断的进化,模型的性能不断地提升,但仍存在一些鲁棒性问题。此外,随着模型更加接近人类行为,产生的“对齐税“会对部分任务性能产生负面影响。
桂韬老师的精彩报告引发了实验室师生的认真思考,大家就涌现能力、推理能力等当前大模型的热点问题进行了广泛且深入的交流讨论。