学术科研

学院举行Frontier in NLP and Data science Workshop In Wuhan 2019

发布日期:2019-11-16 发表者:陈治国 浏览次数:




   (图文|王宇星)11月11日下午,农业生物信息湖北省重点实验室在学院举行Frontier in NLP and Data science Workshop In Wuhan 2019系列学术报告。本次Workshop报告专家有哈尔滨工业大学教授陈清财,德谟克利特国家科学研究中心Georgios Paliouras 和Georgios Katsimpras,日本数据库生命科学中心Jin-Dong Kim教授,我校夏静波副教授,我校研究生王宇星等。Workshop由夏静波副教授主持。


   报告伊始,夏静波简要介绍了与会报告人。与会人员合影后,正式进入报告环节。


   Paliouras教授首先作了题为“Big data integration and analysis for personalized medicine -the iASiS project”的报告。他的报告着眼于利用大量且多样化生物医学数据去做个性化医疗的知识发现。他的研究项目iASiS则集合了2种数据,医学图像和临床文本,并利用知识图谱做后续的知识推断。陈清财教授介绍了“Deep learning in clinical NLP”,他介绍了自己团队在临床医疗文本中运用深度学习技术做知识的发现与提取的工作。他也提到了在医疗文本挖掘中所遇到的困难,如不相连实体的提取,随后他介绍他们团队设计了一套有效标签编码方式从而解决了这个困难。之后Jin-Dong教授“PubCaseFinder:a case-report-based,phenotype-driven differential-diagnosis system for rare diseases”,他介绍了一些疾病虽然是罕见疾病,但罕见疾病的种类繁多,因此十个人中可能就会有一人患有罕见疾病,这是一个不可忽视的数量。接着他介绍了PubCaseFinder一个连接集合各大数据库知识的罕见疾病诊断系统,用户可在这个系统中搜索到有关罕见疾病各种信息。


   茶歇时间,与会人员就上述3场报告进行了热烈讨论。


   王宇星同学介绍了她的课题“Corpus of annotation of genes with alteration-centric function changes and AGAC track”。她介绍了她所参与的突变基因注释语料库AGAC的构建思路和注释设计过程,介绍了AGAC语料库在BioNLP-OST workshop 2019上的表现。


   夏静波副教授作了题为“Graphical model on data synthesis of mutations in the support of drug repurposing”,他介绍了一个创新图模型,将从生物文本中挖掘出来的有关基因突变而产生的功能变化信息和GWAS数据SNP的p值相融合并推断新的突变知识,以此进行药物重定位预测。最后Katsimpras报告“Unsupervised node embedding methods and biological networks”向大家介绍并比较了多种无监督节点嵌入方法在生物网络上的表现效果。他主要研究了基于因式分解和深度学习的2种方法,并利用10个真实生物数据集去评估它们在关联预测,结点分类和结点聚类3个任务中的表现。


   报告结束,现场师生进行了热烈学术讨论。