学术科研

中国人民大学刘勇副教授作题为“大模型机理分析—In-context Learning和数据合成”学术报告

发布日期:2025-02-23 发表者:陈治国 浏览次数:


   (文|辛西 编辑|信息 审核|陈洪)2月21日上午,中国人民大学高瓴人工智能研究院刘勇副教授做“Happy Hour”,在线为大家带来题为“大模型机理分析——In-context Learning和数据合成”的学术报告。报告围绕“大模型理论研究背景、大模型ICL隐式更新机理分析、基于LLM的合成数据有效性分析、未来工作”四方面展开,从大模型ICL的内在原理梳理、学习理论解析、泛化分析和实验验证等多维度进行了探讨,阐述了探索大模型内在机理的理论路径。整场报告内容丰富,逻辑清晰,深入浅出,启发了在场师生对大模型机理的思考,激发了大家对相关研究领域的浓厚兴趣。报告结束,师生就大语言模型的理论分析方向及基于LLM的数据合成等热点问题进行了深入探讨。


   刘勇,中国人民大学长聘副教授,博士生导师,国家级高层次青年人才。长期从事机器学习基础理论研究,发表论文100余篇,其中以第一作者/通讯作者发表顶级期刊和会议论文近50篇,涵盖机器学习领域顶级期刊JMLR、IEEE TPAMI、Artificial Intelligence和顶级会议ICML、NeurIPs等。曾获中国人民大学“杰出学者”、中国科学院“青年创新促进会”成员、中国科学院信息工程研究所“引进优青”等称号。主持/参与国家自然科学面上/青年基金、科技部重点研发、北京市科技计划中央引导地方专项、北京市面上项目等项目。