(文|辛西 编辑|信息 审核|陈洪)2月21日上午,中国人民大学高瓴人工智能研究院刘勇副教授做“Happy Hour”,在线为大家带来题为“大模型机理分析——In-context Learning和数据合成”的学术报告。报告围绕“大模型理论研究背景、大模型ICL隐式更新机理分析、基于LLM的合成数据有效性分析、未来工作”四方面展开,从大模型ICL的内在原理梳理、学习理论解析、泛化分析和实验验证等多维度进行了探讨,阐述了探索大模型内在机理的理论路径。整场报告内容丰富,逻辑清晰,深入浅出,启发了在场师生对大模型机理的思考,激发了大家对相关研究领域的浓厚兴趣。报告结束,师生就大语言模型的理论分析方向及基于LLM的数据合成等热点问题进行了深入探讨。
刘勇,中国人民大学长聘副教授,博士生导师,国家级高层次青年人才。长期从事机器学习基础理论研究,发表论文100余篇,其中以第一作者/通讯作者发表顶级期刊和会议论文近50篇,涵盖机器学习领域顶级期刊JMLR、IEEE TPAMI、Artificial Intelligence和顶级会议ICML、NeurIPs等。曾获中国人民大学“杰出学者”、中国科学院“青年创新促进会”成员、中国科学院信息工程研究所“引进优青”等称号。主持/参与国家自然科学面上/青年基金、科技部重点研发、北京市科技计划中央引导地方专项、北京市面上项目等项目。
版权所有:华中农业大学信息学院 地址:湖北省武汉市南湖狮子山街一号 邮编:430070
联系电话:027-87288509 招生就业电话:027-87286876 电子邮件:coi@mail.hzau.edu.cn 新闻投稿邮箱:coi-xinwen@mail.hzau.edu.cn