学术科研

学术报告:基于合成数据的场景文字检测与识别研究

发布日期:2016-12-06 发表者: 浏览次数:

报告题目:基于合成数据的场景文字检测与识别研究

报告人: 白翔 教授

报告时间:2016年12月7日(周三)16:00

报告地点:逸夫楼C座314会议室

摘要:

近年来,场景文字识别(Photo OCR)成为模式识别及相关领域中的一个热点问题,在图像理解,商品搜索,无人驾驶定位及导航,人机交互及虚拟现实等有着重要的应用价值。本次报告中,我首先会介绍近年来深度学习研究在此领域的研究现状;然后,我将介绍本研究团队在此领域的近期研究成果:基于深度神经网络的场景文字自动矫正方法(CVPR16);基于全卷积网络的多方向场景文本检测方法(CVPR16);基于合成数据的场景文字端到端识别及检索算法框架(AAAI17)。最后,对此方向的未来研究趋势和应用前景作出展望。

报告人简介:

白翔,华中科技大学电子信息与通信学院教授,博士生导师,国家防伪工程中心副主任。先后于华中科技大学获得学士、硕士、博士学位。曾先后访问于美国Temple大学和加州大学洛杉矶分校,入选微软铸星计划。他的研究领域为计算机视觉与模式识别,具体包括目标识别、形状分析、自然场景文字识别及智能交通系统。他已在计算机视觉与模式识别领域一流国际期刊和会议如PAMI、IJCV、CVPR、ICCV、ECCV、NIPS、ICML上发表论文30余篇,担任国际期刊Frontier of Computer Science, Pattern Recognition Letters, Neurocomputing, Pattern Recognition, Journal of Computer Science and Technolgy等编委或客座编辑。尤其在形状的匹配与检索、场景OCR取得了一系列重要研究成果,引起了国际同行的关注,入选2014、2015年中国高被引学者。他的研究工作曾获微软学者,国家自然科学基金优秀青年基金的资助。担任中国计算机学会计算机视觉专委会(CCF-CV)常务委员,中国图象图形学学会理事,是视觉与学习青年研讨会(VALSE)在线活动主要发起人之一。