学术科研

【信息逸站】如何用机器学习分析表观遗传的生物大数据?

发布日期:2016-03-08 发表者:辛西 浏览次数:

如何用机器学习分析表观遗传的生物大数据?

——哈佛-麻省理工博德研究所张智卓博士做客“信息逸站”

(文|信息学院通讯员方亚平)3月8日上午,哈佛-麻省理工博德研究所(Broad Institute of MIT and Harvard)张智卓博士应我校信息学院李国亮教授的邀请,在逸夫楼C座314会议室为我校师生带来了一场题为“Large Scale Epigenomics data reveal the underlying mechanisms of gene regulation and complex diseases”的学术报告。会议由李国亮教授主持。

张智卓博士以ENCODE计划和表观基因组学路线图计划为切入点,展示了他们实验室很多的研究成果,从多个角度对生物大数据的分析和应用进行了深入介绍,阐述了如何利用机器学习的方法对表观遗传的生物大数据进行分析。他首先介绍了包含有110种以上人体组织和细胞的参考表观基因组的构建方法和特点,分析了表观修饰的模块性及其在不同细胞中的特异性,构建了Imputation方法对表观基因组进行注释、对实验结果进行预测,进一步利用增强子基因信息和表观修饰的模块性对细胞特异性进行有效的解释,利用深度学习的方法构建了复杂的表观修饰调控的“语法”模型,对不同的组织和细胞的调控模型进行理论解释,最后将理论分析和实验验证相结合,介绍了如何利用注释的参考表观基因组及其模块性对多种疾病相关GWAS数据进行深度解析,确定其致病的分子机理。张智卓提及的相关研究方法和思路对植物育种与改良、动物疾病、水产生物的疾病都具有借鉴意义。

张智卓博士的研究内容引起在场师生极大兴趣。来自信息学院、生科院、水产院、植科院和动科动医学院的师生和张智卓进行了热烈讨论和交流。会后,张智卓也对前来咨询的师生进行了解疑答惑。

【人物简介】张智卓博士本科毕业于华南理工大学,2013获新加坡国立大学计算机专业博士学位。2014年至今在哈佛-麻省理工博德研究所(Broad Institute of MIT and Harvard)做博士后,目前的研究方向是机器学习及其在生物大数据中的应用。