学术科研

西安交大刘军民教授作“深度神经网络的随机梯度噪声分析理论及应用”学术报告

发布日期:2023-10-20 发表者:陈治国 浏览次数:




   (图文|信息 编辑|信息 审核|李函)10月19日上午,西安交通大学数学与统计学院教授、博士生导师刘军民受邀参加信息学院线上学术分享会,作了题为“深度神经网络的随机噪声分析理论及应用”学术报告,吸引了近40名师生参加会议。


   刘军民教授首先梳理了深度神经网络的模型背景、工作原理和理论分析框架等知识,进而对当前深度神经网络的泛化理论结果进行了详细比较和分析,引出了理论刻画与实际随机梯度下降算法实验观测不匹配这一关键问题。基于对这一问题的思考,刘军民探讨了依赖优化过程的泛化分析路径,借助随机梯度噪声的分数阶布朗运动来探索深度神经网络泛化性的合理刻画,理论和实验结果验证了研究方案的可行性和有效性。


   该报告深入浅出讲解了深度神经网络的随机梯度噪声分析理论及应用技巧,探讨了未来一些有价值的研究方向。报告最后,入会师生就理论分析难点及应用场景等与刘军民老师进行了探讨交流。