2026年计算机科学系学术讲座(一)

发布时间: 2026-01-20 来源:

目:LLaDA:大语言模型新范式

内容简介:本次报告聚焦一个问题:自回归是否是通向当前乃至更高水平的生成式智能的唯一范式?本次报告首先从统一概率建模的视角总结当前基础生成模型的发展,并从这个视角出发指出大语言模型的性质(如可扩展性、指令追随、情景学习、对话、无损压缩)主要来自于生成式准则,而非自回归建模独有。基于这些洞察,介绍扩散大语言模型LLaDA系列工作,包括基础理论、扩展定律、大规模训练、偏好对齐、多模态理解和MoE架构等。LLaDA通过非自回归的方式,展示了令人惊讶的可扩展性和多轮对话能力。这些结果不仅挑战了自回归模型的统治地位,更加深了我们对生成式人工智能的理解。

报告人:李崇轩

报告人简介:中国人民大学高瓴人工智能学院副教授,博士生导师,国家高层次青年人才。致力于生成模型基础理论、建模范式、大规模训练策略和高效采样算法的研究,带领团队研制扩散大语言模型LLaDA,谷歌学术引用一万余次;获机器学习领域顶级国际会议 ICLR 2022 杰出论文奖、吴文俊人工智能自然科学一等奖。主持国家自然科学基金青年科学基金B类(原国家优青)、重大研究计划培育项目等;入选智源学者、吴文俊优秀青年奖、北京市科技新星;兼任IEEE TPAMI 编委和ICLR/NeurIPS/ICML领域主席;作为主编出版《大模型十讲》教材,指导学生入选国家自然科学基金青年学生基础研究项目(博士研究生)、字节跳动奖学金计划等。

时间:2026124日(周10:00开

点:石牌校区南海楼407会议室



热烈欢迎广大师生参加!