学术科研

我院机器学习与计算机视觉团队在开放集三维表征学习领域取得新进展

发布日期:2025-04-15 发表者:陈治国 浏览次数:


   (图文|信息  编辑|辛西  审核|何新卫)近日,我院人工智能系何新卫老师撰写的1篇名为“CLIP-AdaM: Adapting Multi-view CLIP for Open-set 3D Object Retrieval”的文章被SIGIR-2025主会长文录用。该研究聚焦于3D模型检索领域的前沿问题,创新性地提出一种基于大规模预训练模型CLIP的轻量级适配框架——CLIP-AdaM,专注于解决开放场景下3D模型检索的类泛化难题。现有的开集3D对象检索方法通常依赖于复杂的多模态输入(如点云、体素等)来进行检索并匹配,而CLIP-AdaM通过充分挖掘CLIP在自然图像上的强大表征能力,仅基于有限已知类别3D模型的多视图,通过高效适配微调技术便能实现高精度的开集3D模型表征提取与检索。


   SIGIR (International ACM SIGIR Conference on Research and Development in Information Retrieval) 是信息检索领域的顶级国际学术会议,在中国计算机学会(CCF)推荐论文目录中被列为A类国际学术会议。信息学院人工智能系何新卫为该论文第一作者,华中科技大学软件学院白翔为论文通讯作者。2023级硕士研究生马良为论文第二作者,工学院2022级本科生程宇轩,我院24级研究生王之川参与该研究。我院王玉龙、向金海老师,深圳大学周漾老师参与论文指导。该工作获国家自科基金青年项目、省自科青年基金项目和校自主创新基金支持。