(图文|杨庆勇、黄紫阳、秦丽、徐士伟、辛西)7月3日上午,第5届南湖国际青年科学家论坛第2场信息学院分论坛在线上线下同步举行。来自哈佛大学、南澳大学、英国皇家艺术学院、桂林电子科技大学的4位青年科学家围绕RNA生物信息学软件开发及应用、因果效应估计、自主机器人导航和数据隐私保护等内容作了精彩学术报告,与会师生与报告人进行了充分、深入、热烈的交流讨论。信息学院师生参加会议。院长张红雨教授主持会议并致辞,他简要介绍了学校、学院历史概况、发展沿革、专业设置、学科建设、人才队伍,并对青年学者的应邀做报告表示欢迎。
首先,哈佛大学医学院和波士顿儿童医院刘琦博士围绕“RNA生物信息学的软件开发与应用”,系统汇报了近5年他作为主要完成人参与的RNA修饰鉴定和注释的软件RNAmod、基于Ribo-Seq的RNA翻译分析软件RiboToolkit,以及小RNA鉴定、定量以及小RNA修饰鉴定的软件sRNAtools等多个生物信息学软件开发工作,并结合RNA修饰等热点生物学问题分享了上述软件在相关研究中的应用。以tRNA修饰的m7G修饰为例,刘琦介绍了通过综合利用公共数据和软件预测方法,结合实验验证等方法探索Mettl1基因在肿瘤形成作用的机理。当敲除m7G的甲基化转移酶Mettl1时,mESC向神经细胞分化受到抑制,通过开发的sRNAtools鉴定到22种m7G修饰的tRNA,并且Mettl1的缺失影响m7G修饰tRNA的稳定性,进一步通过RiboToolkit鉴定到上千个差异翻译的基因,对这些基因的功能富集分析发现,神经发育相关基因及细胞周期相关基因的翻译受到显著影响,RiboToolkit的分析进一步分析表明这些基因上的m7G tRNA解码的密码子在这些基因上的频率相对其他基因具有显著增加,同时分析表明神经发育相关基因的平均长度相对其他基因更长,更容易受到m7G tRNA变化的影响。上述结果表明,tRNA的m7G修饰能影响特定基因的翻译从而阻碍小鼠胚胎干细胞(mESC)向神经细胞的分化,METTL1介导的m7G tRNA修饰会驱动肿瘤恶性转化,该系列研究工作显示了tRNA的m7G修饰在细胞分化、肿瘤发生等生物学途径的重要作用,为肿瘤形成作用的机理、肿瘤的诊断和治疗等医学研究提供了新思路。
其次,南澳大学程德波博士作了题为“从含有隐变量的观测数据进行因果效应估计”的学术报告。程德波首先介绍了因果推断的含义及其研究背景,接着提到从数据中进行因果推断的4个挑战:可用数据仅是观测数据,因果效应的回归/匹配估计因错误的混杂因素而产生偏差,具有隐藏变量的数据可能无法找到精确的调整集,现有估算效率低且时间复杂度较高。随后程德波介绍了其团队提出的“无因果关系的数据驱动的因果效应估计算法(DICE)”,并展示了该算法在3种数据集上的表现。程德波最后对报告做总结,将有效的局部因果结构发现用于因果查询,并确保通过局部搜索获得的因果查询结果的正确性;DICE算法不仅为决策者提供了有关更改系统中一个变量的影响的信息,还使决策者了解可能影响因果效应的其他因素。
随后,英国皇家艺术学院吴萌博士作了“基于地球物理信息的自主机器人导航及路径规化研究”的报告。吴萌毕业于华中科技大学模式识别与人工智能研究所,先后到武汉大学、美国康涅狄格大学、新加坡科技设计大学从事博士后研究,现任英国皇家艺术学院研究员。他的报告分2部分,第1部分主要探讨地球物理信息数据如何帮助机器人实现目标物体距离的检测与导航,这里的地球物理信息数据主要通过重力梯度传感器获取的重力梯度数据,通过对重力梯度张量、连续重力梯度张量与离散重力梯度张量的反演计算可得到待检测物体的距离与方位,吴萌将这个方法应用到水下目标检测中,水下目标检测由于光线条件弱,且有水介质的干扰,所以不适合视觉传感或激光传感的数据分析,而重力梯度数据只与物体的重量与密度相关,可更好解决这个问题。第2部分着重探讨基于混合APF-重力梯度反演算法的路径规划方法,吴萌提出在重力梯度反演算法基础上,利用人工势场(APF)进行地形规划,并建立APF适应度函数。利用重力梯度反演算法计算机器人与障碍物中心相对距离,然后根据该距离建立APF中的排斥势场函数,从而实现机器人的运动规化,他将此种思路应用到室内变形机器人的路径规化与无人机的UWB定位与着陆中,取得不错效果。
最后,桂林电子科技大学计算机与信息安全学院刘忆宁教授作了题为“数据发布中的隐私保护”的报告。随着信息化高速发展,隐私保护已成为学术界和工业界关注的焦点,根据被保护对象不同,隐私保护可分为身份隐私保护和数据隐私保护2方面。刘忆宁首先介绍了其团队在数据认证与备份、车联网安全与隐私、可验证公平性协议研究和图像安全与隐私方面的研究工作和发表主要论文。然后,刘忆宁重点介绍了其研究团队在数据发布中的隐私保护领域的研究工作:在安全电子投票协议方面,系统分析并证明了Bingo Voting电子投票协议无法抵抗来自不诚实投票者的侧信道攻击,并提出替换其现场生成随机数的方式,以避免相关攻击;在数据安全聚合方面,提出基于差分隐私和基于虚拟域的数据聚合方案;在用户匿名认证方面,实现了保证身份信息原始状态和不可链接性,以及不需要可信第三方的N-源匿名认证方案;在轨迹隐私的保护和攻击方面,提出了一种基于CNN(卷积神经网络)的假轨迹鉴别方法,并进一步基于GAN(生成对抗网络)提出了一种更加符合人类行为特征的假轨迹生成算法。