By 谢健聪
计算机学院坚持立德树人“一条主线”,致力于构建完善的“三全育人”工作体系,全面推行了学业导师、科研导师、职业导师的全程导师计划,提升学生的学习力、思想力和行动力,培养能够引领未来的人。此篇心得是我院2018级计算机科学专业本科生谢健聪同学的来稿,相信对于正在选择科研导师的同学们能有所帮助。
谢健聪,中山大学2018级计算机科学专业本科生,2022年9月免试继续攻读硕士,本科期间成果已经作为共同第一作者在Cell的姊妹刊Chem上发表文章,另一篇第一作者论文已投到顶会审稿中。
大二上学期,学院安排了科研导师互选的活动,提供一个能提前进入实验室感受科研氛围的机会。我选择了杨跃东老师作为科研导师,杨老师也十分关心本科生的科研,立刻安排师兄师姐来指导我们。令我印象深刻的是,师兄非常负责,每周给我们上课,帮助我们入门机器学习和深度学习,同时杨老师也会给我们安排比赛和任务去锻炼我们。这让我不仅了解了前沿科学技术,也对其他专业课程的学习有了更深刻的认识。
回顾本科三年的科研之路,最重要的是积极和坚持。作为一名科研小白,一开始难免遭遇很多挫折,很多人选择半途而废。特别是大二那年因为疫情无法上学,我在家坚持自学,积极主动和老师与师兄讨论问题,并把握住空闲的时间协助师兄完成实验。经过一年多的学习,大三期间,老师让我独立去完成一个课题。那是我初次接触完整课题,用深度学习方法发现疾病和基因的潜在关联,其中遇到了很多困难。一方面我需要收集许多相关数据,作为计算机学子的我,一开始难免对生物相关数据集产生抵触,在内心深处建立起学科间的屏障。为了突破这层障碍,我积极地向老师和师兄请教。在熟悉这些数据集之后,发现很多知识都是和我们平常的就医用药相关,其实不需要太多时间就能理解掌握。所以,只要内心不排斥,敢于尝试,敢于钻研,就能打破阻碍你前进的屏障。另外在算法方面,没有人可以一蹴而就。为此需要查阅大量的文献,积累各方面的知识,并不断融入自己的想法。当时我和师兄日日夜夜地尝试了很多方法,并从失败中总结原因。在每次组会中,杨老师也提出了很多宝贵的建议,为我们指明方向。由于第一次投稿顶会论文,时间也有点赶,最后遗憾收到拒稿,但这些挫折都是科研路上宝贵的经历,同时也是成长路上不可多得的磨练。正是失败赋予了成功真正的涵义。挫折,彷徨和失败都不可怕,可怕的是没有积极的心态,没有坚持下去的恒心。目前该论文重新修改转投另一个A类会议。
在大四那年,我开展了与广州实验室的合作工作。实验合作团队建立了自动化实验方法,利用高通量技术开展化学反应试验,而我则负责根据实验数据构建化学反应产率的预测模型。在该工作中,实验合作团队建立一种全新受阻间位C–H键活化反应,测定了24种酮和43种芳基三氟硼酸钾之间共1032个反应产率数据,然而这些数据相对深度学习来说样本量仍旧太小,难以构建一个准确、稳健的预测模型。为此,我们结合本实验室的前期研究基础,通过收集其它已知约48万条化学反应的真正大数据集合,结合知识图谱方法预训练获得分子的嵌入表征。同时结合实验室前期开发的点边交互通信(CMPNN)图卷积模型方法,进一步增强分子的表征学习,交叉验证和独立测试结果表明该模型具有优秀的预测和泛化性能。另外,我们进一步采用图神经网络的可解释性方法CAM-GRAD,标注分子结构中对产率有重要影响的原子或结构片段,其结果与化学家预期一致,而且在一些案例中发现了一些远程的、化学家难以预料的关系。该工作于9月发表于国际顶级期刊、Cell的姊妹刊Chem上。后续合作工作仍在开展之中。
计算机学子一谈到生物信息等交叉领域,都觉得它是深奥难懂、复杂和遥不可及的。作为一个标准的计算机学子,我在踏入实验室参与科研之前也是这么认为的。自从我进入实验室的3年来,凭着高中的生物化学知识,在遇到问题时请教老师师兄或自己查阅相关文献,基本都能在很短时间内能解决,而且实验室其他师兄师姐大多也是计算机背景。只要肯拿出勇气迈出第一步,它并没有我们想象的那么艰难。
交叉学科不同于传统计算机专业,不需要挤在标准数据集的独木桥上,竞争相对较小,也更容易出一流的结果。另一方面,交叉学科更着重于解决实际问题,在研究过程中也培养了我解决实际问题的能力。同时,很多AI技术的灵感来源于其他学科,随着对其它相关学科的深入了解,我对AI技术也有了更加深入的领悟。
近年来,人工智能和传统科研相结合,催生AI for Science全新范式,使人类能够以前所未有的规模和效率开展科学研究,达摩院也将AI for Science列为《2022十大科技趋势》之首。我们实验室也一直致力于AI for Science,探索深度学习、智能化、自动化和生物医药有机融合的模式,同时依托天河二号的高性能计算,为生物医药产业赋智赋能。