实验室聚焦生物多尺度信息融合难点,通过结合高性能计算和人工智能算法,解决生物医药科学中的重大问题,为生物医药产业赋智赋能,开发准确且超快的疾病诊疗和新药研发算法,并基于“天河二号”构筑大数据分析和计算统一的云超算平台,为产学研应用提供一站式服务。
随着健康大数据的快速发展,健康医药已成为AI产业应用的一个热点,腾讯、阿里、华为等公司均纷纷布局相关产业开发,而今年的抗击疫情充分展示了大数据分析在人类健康中的重要作用。疫情期间,本实验室充分利用“天河二号”的超强算力,开展了基于CT的智能诊断、药物智能推荐算法、及医药知识图谱等一系列工作,取得了多项重要成果。项目涉及CV、NLP、ML、知识图谱等多个领域,广泛运用到了各种前沿AI技术,对任意技术感兴趣的同学都能在这里找到属于自己的舞台。我们与其他大多数AI实验室所不同的地方在于更着重于培养学生解决真实物理世界难题,研究过程中学会发现、分析、并解决问题,也更容易被IT大公司所青睐。
很多计算机背景同学看到我们的介绍就望而止步,误解需要大量的生物化学学习,实际上我们的重点是研究计算机算法去解决生物医药的问题,核心还是算法,研究组的学生绝大多数是计算机背景,当然适当的生化知识对深入的研究有很好的支持。实验室鼓励学生去国内外著名大学深造,实验室的AI+Science研究方向更合适有科学研究抱负的同学,有更深远的发展空间,欢迎感兴趣的本科生联系。
参考实验室成员撰写的 《计算机本科生参与科研心得体会》:全文链接
实验室长期招聘研究生、博士生、博士后。相关研究方向背景合适的学者也可以向学院推荐申请副教授或教授职位。
目前主要研究内容包括多个维度:生物分子的几何图网络表征,大模型+知识图谱驱动的多尺度组学数据挖掘、融合分子模拟的药物分子智能设计,基于“天河二号”的生物医药高性能计算平台研发及应用(平台及应用)。
蛋白质是生物体最重要大分子之一,参与几乎所有的生命活动,准确预测蛋白质三维空间结构和折叠过程被列为21世纪重大科学难题之一。从2013年起,PI就利用深度学习技术开发出蛋白质二级结构预测SPIDER系列,是国际上最早将深度学习用于蛋白质二级结构预测的研究之一,此后不断引入多任务学习、模型的迭代训练等策略,并将结构预测从以前的二级结构离散状态转换为连续数值预测。
围绕药物设计全流程,开发了基于AI的全流程算法,包括药物筛选、分子优化、ADMET性质预测、化学合成路线预测等。相关代表性工作包括:
随着组学数据多样化和规模化,能从多个时空尺度、不同视角全面阐释生物个体的状态,使得多组学数据分析扮演着越来越重要的角色。然而,多组学的多噪音、高维度、及变量间的复杂关系,需要借助先验知识,才能实现准确的多组学数据分析。