联合华为、新格元两家各领域龙头公司共同研发的单细胞大模型CellFM正式预发表(biorxiv 2022.06.05.494905v2),该模型基于超1亿人类细胞训练(是其它模型两倍以上),通过华为升腾芯片训练得到超8亿参数的模型,是该类模型参数的8倍以上。该模型是此前与鹏城联合研发的72种脊椎动物RNA大模型SpliceBERT(约2千万参数,BIB 2024:bbae163)、和药物多模态预训练模型MIGA(6千万参数, Advanced Science 2024)之后的又一个预训练大模型。 未来,将充分利用超算算力和广泛的用户合作基础,在更多生物子领域开展预训练模型研究,从而最终构建面向生物的多尺度星生大模型,促进生物医药研究发展。
第一组(多组学 & 医疗): 曾远松、陈恳、林斯颖、潘子祥、钟凤琪、魏琢艺、丁茂林、罗迈、庞雨贤、陈嘉宁
第二组(分子蛋白质&药物设计): 饶家华、袁乾沐、王宇星、宋益东、王一、刘德钦、谢健聪
(陈晟、谢俊杰、王静)
饶家华、袁乾沐、王宇星、宋益东、王一、刘德钦、谢健聪
(陈晟、谢俊杰、王静)