报告华体会网页版登陆入口:4月24号19:00-21:00
报告地点:中南大学新校区信息楼535会议室
报告一
题目:新一代百千万量级样本全基因组遗传数据的高效存储和管理模型
报告摘要:
解析疾病复杂表型的遗传图谱往往需要处理大规模样本的基因型数据,例如包UKBB已有数四十多万受试者的全基因组基因型(>100TB)。然而,由于缺乏高效的数据结构和访问算法,大规模基因型数据的存储、访问、管理和计算非常困难。为此,我们提出了一种新的基因型数据区块结构(GenoType Block,GTB)和相应的高并行IO框架(Genotype Blocking Compressor,GBC)。GTB是一种可高速寻址的、统一字节编码的数据结构,能帮助用户高效地存储和管理基因型数据。同时,GBC通过优化的并行压缩和解压缩过程,提高数据访问和管理的速度,实现对基因型数据的快速读写。在保持高压缩比同时,GBC访问和管理压缩的大规模基因型的速度相比于同类方法可达1000倍以上,普通工作站上进行UKBB基因型的连锁不平衡计算比PLINK V1.9算法快了56倍以上。GBC提供了友好的交互界面和丰富的API函数库,可能将成为未来大规模基因型数据的研究中不可或缺的工具。
报告人简介
中山大学“百人计划”引进教授,医学信息学教研室主任,逸仙优秀学者。2009年获香港大学博士学位。2013年初起在香港大学医学院组建精准医学研究团队,2016年底全职加盟中山大学中山医学院。围绕遗传性流行病精准防控,基于交叉学科策略,聚焦研发高效的致病基因定位理论与原创方法,在遗传学、生物信息学等领域取得了多项被国际同行高度认可的成果,最后通讯作者论文发表于American Journal of Human Genetics、Genome Biology等权威期刊,论文总引用七千余次,方法被写入华大基因数据分析标准等多个国内外专业教程,部分成果整合实现在KGG系列软件中。2021年获香港最佳青年学者奖。
报告二
题目:高通量测序驱动的人体微生物组学研究
报告摘要:
微生物组学的研究对象人体共生微生物(以肠道菌群为主),高通量测序技术的发展和相应的生物信息学技术的演进极大的推动了我们对于人体共生微生物的研究。共生微生物是什么?它们在干什么?它们如何形成?这些问题对于我们站在“宿主-微生物”这一共生生态系统的角度理解人类的健康与疾病至关重要。丁涛课题组应用高通量测序手段,开发生物信息学工具系统研究微生物组学数据,研究其所指示的生物学和医学意义。课题组前期基于DMM模型提出了人体微生物组群落组型(community type)的概念,建立了一系列对应的研究人体菌群动态和决定因素的方法。课题组目前的研究重点是人体菌群的决定因素和组装过程,最新的研究基于中性模型提出了口腔和鼻腔微生物的差异化输入决定了肺部菌群的多样化,揭示了肺部菌群的组装过程。
报告人简介
丁涛,中山大学中山医学院教授,博士生导师。国家高层次海外引进青年人才(中组部),中山大学“百人计划”中青年杰出人才,逸仙优秀学者。现为广东精准医学应用会微生态医学分会副主任委员、中国生物物理学会肠道菌群分会委员、粤港澳肠道微生态联盟理事。微生物组学领域国际知名期刊Microbiome和ISME审稿人。现主持和参与包括国自然面上、国家重点研发计划和广东省科技计划项目在内等多项课题。迄今为止以第一作者或通讯作者在Nature、Advanced Science、Microbiome、Microbiology Spectrum、mBio等高水平杂志发表多篇研究论文。