2023 智源大会上,AI生命科学论坛在昌平国家实验室主任,北京大学教授谢晓亮的主持下顺利召开。本次论坛的联合主席是智源研究院健康计算研究中心负责人叶启威。
论坛由诺贝尔化学奖得主 Arieh Warshel 的主题报告开场,介绍了如何利用人工智能研究中酶的多尺度问题;随后北京大学化学与分子工程学院教授高毅勤、Mila – 魁北克人工智能研究院副教授唐建、西湖大学遗传学讲席教授、副校长许田、北京大学生物医学创新中心 (BIOPIC) 研究员高歌依次围绕相关领域给出了主题报告。讲者们在报告和最后的讨论中,洞察深刻,直面问题的核心,指出了人工智能在生命科学领域的真实作用。
Mila – 魁北克人工智能研究院副教授唐建带来了《建模大分子药物的基础模型》主题报告,介绍了如何利用图神经网络或几何深度学习对蛋白质的图结构进行表征。唐建介绍,他们设计的 GearNet 方法,不仅在节点之间进行信息传递,而且在边之间也能进行信息传递,可以更好利用蛋白质在空间上的三维结构。此外,如果利用多模态学习的方法,基于蛋白质的序列结构以及文本功能描述来学习蛋白质特征表示,也可以帮助我们更好地理解蛋白质的结构。
唐建还介绍了一些预测蛋白质结构的工作。当前方法主要预测主链,他们设计侧链预测模型,参数少,可以大幅度提升了准确性和效率。在设计新型蛋白质的工作介绍中,提出基于扩散模型设计结构和序列的方法,通过不断地精炼(refine)结构和序列,模型可以逐渐收敛到一个稳定的结构和序列。此方法的输入包括当前蛋白质序列、结构以及靶点等背景信息。
最后唐建总结道,在蛋白质特征表示层面,传统方法主要基于序列特征表示学习,而未来的趋势将更多地侧重于基于结构的特征表示学习。蛋白质结构预测,相比之前的方法主要关注蛋白质骨架结构的预测,未来的研究将更加重视侧链预测建模。此外,未来可能会涉及到对所有原子(包括骨架和侧链)进行建模,以及更好地对分子间相互作用和复合物结构进行建模。蛋白质设计是一个非常受欢迎的研究方向,有潜力找到比自然界蛋白更好功能的蛋白质序列。
论坛还包括专家问答和观众问答环节。详细报道请阅读此文章。