80后诺奖得主:AlphaFold下一步融合大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
80后诺奖得主:AlphaFold下一步融合大模型
7935点击    2025-11-28 13:59

正值AlphaFold问世五周年,其设计者、也是凭借AlphaFold获得诺贝尔化学奖的John Jumper公开表示:


AlphaFold的下一步是与大模型融合。


不过具体方法并没有透露,或许已有所思路,甚至已经在进程之中。


80后诺奖得主:AlphaFold下一步融合大模型


五年期间,AlphaFold已经帮助全球300多万研究人员,预测了数亿种蛋白质的三维结构,并影响了超50万篇相关论文。


可以说,这是继量子力学和分子生物学革命后,生命科学的又一次重大跃迁。


80后诺奖得主:AlphaFold下一步融合大模型


继最初的“结构预测革命”、随后的“科研常规工具”化,AlphaFold及其继承技术正在进入新的大模型阶段。


AlphaFold+大模型


即使是在AI浪潮不断涌来的今天,AlphaFold仍然是AI+生命科学最具里程碑意义的一次落地。


作为一款由谷歌DeepMind开发的AI科研工具,AlphaFold能够精确预测蛋白质的三维结构。


利用存储在序列和结构数据库中的大量实验数据,该网络被训练以发现氨基酸序列之间的关联和模式。


80后诺奖得主:AlphaFold下一步融合大模型


2020年首次公开AlphaFold2以来,它就迅速成为结构生物化学领域的坚实基座,接着又陆续推出了可预测多个蛋白质结构的AlphaFold Multimer,以及迄今为止速度最快的AlphaFold 3。


现在AlphaFold已经从最初单纯地蛋白质结构预测,发展到能够处理更为复杂的多分子复合体以及更广范围的生物分子交互。


科学家们也据此,实现了相当多的成果突破:


例如最近来自密苏里大学的研究团队,借助AlphaFold,成功揭开了心血管疾病的秘密——坏胆固醇(LDL),并刊登上了《Nature》。


80后诺奖得主:AlphaFold下一步融合大模型


LDL是动脉粥样硬化、冠心病等心脏疾病的主要风险因子,核心由ApoB100蛋白组成,但由于其体积巨大、结构复杂,同时又与脂肪紧密缠绕,长期以来科学家都无法确认它的原子级三维结构。


于是他们利用AlphaFold先对其氨基酸序列进行结构预测,再将生成的模型拟合到密度图中,并逐步优化,直到与实验数据对齐。


80后诺奖得主:AlphaFold下一步融合大模型


最终揭示了ApoB100的笼状结构,为后续推动心血管疾病治疗提供了理论依据。


再比如说,利用AlphaFold研究蜜蜂的抗病性


80后诺奖得主:AlphaFold下一步融合大模型


该研究聚焦蜜蜂体内的关键蛋白Vitellogenin(简称Vg),该蛋白不仅支持群体后代喂养,还与蜜蜂的免疫力、抗压力息息相关。


在AlphaFold的帮助下,研究人员得以在两天时间内完成过去数年的工作,解密了Vg蛋白的近原子级结构模型,对濒危种群的保护起到了关键性指导作用。


另外,AlphaFold在一些非常规用法上也依旧作用显著。


去年与John Jumper同获诺贝尔化学奖的计算生物学家David Baker,就正在尝试利用AlphaFold预测蛋白质合成设计的成功率。


或者有些团队也会将AlphaFold作为搜索引擎使用,在成千上万个候选蛋白中筛选出最有可能与目标蛋白结合的一种。


……


总之,AlphaFold的作用不胜枚举,它已经不仅仅是单一的结构预测工具,更是当代实验设计的重要组成部分之一。


那么接下来AlphaFold又将何去何从呢?


80后诺奖得主:AlphaFold下一步融合大模型


据John Jumper所说,下一步将会是AlphaFold与更广泛的AI大模型结合


AlphaFold仍将继续推动结构预测成为研究流程中的基础一环,但与此同时,其结构预测能力也会同大模型强强结合,提升到能读懂科学文献数据、做科学推理的程度。


也就是说,接下来的AlphaFold在预测结构之外,或许还能提出假设、设计实验流程甚至自动生成研究思路。


对于一些更复杂的多分子多功能系统,例如蛋白之间的相互作用、核酸(DNA/RNA)的相互作用等,AlphaFold也能更好地帮助理解对应的生物过程。


这就好比谷歌的另一个系统AlphaEvolve,使用一个大模型来生成问题的解决方案,然后再用第二个模型负责检查并过滤掉错误信息。


二者思路类似,不过一个面向数学和计算机科学领域,一个立足生物化学。


首位“80后”诺奖得主


负责领导开发AlphaFold的,则是DeepMind创始人兼CEO哈萨比斯John Jumper


80后诺奖得主:AlphaFold下一步融合大模型


其中,John Jumper还是最年轻的诺贝尔化学奖得主,也是首位80后诺奖得主


他本科就读于范德堡大学,主修数学和物理,随后又在剑桥大学获得理论凝聚态物理硕士,并在芝加哥大学博士期间转向理论化学。


他的博士论文就是研究如何将机器学习技术应用于蛋白质动力学研究。


2017年,正在读博士后的他听说了谷歌DeepMind正在从游戏AI开发秘密转向蛋白质结构预测,于是他申请了这份工作。


80后诺奖得主:AlphaFold下一步融合大模型


事实上,在AlphaFold之前,谷歌DeepMind就尝试了名为“Foldit”的蛋白质折叠游戏,这还是因为哈萨比斯从剑桥求学时代起就对蛋白质折叠问题的关注,他希望通过预测蛋白质结构,找到解决阿尔茨海默症等疾病的方法。


但游戏终归只是游戏,在面对真实的分子结构上显然不够用,因为真实的蛋白质折叠的训练数据极为固定有限。


要确定一个蛋白质结构,往往需要耗费数月甚至数年时间,而这一过程已经持续了将近半个世纪


80后诺奖得主:AlphaFold下一步融合大模型


于是他们转向研发了AlphaFold


虽然初代AlphaFold在第13届CASP(蛋白质结构预测关键评估赛事)中崭露头角,成功预测出43个蛋白质中的其中25个,力压其余的97名参赛者,证明了用“机器学习+统计信息”推断蛋白质结构是可行的。


但哈萨比斯坦言,当时的预测质量还不足以让生物学家在实际中应用,其针对复杂蛋白的准确性、泛化性还存在严重缺陷。


80后诺奖得主:AlphaFold下一步融合大模型


在意识到仅依靠标准的机器学习方法无法取得成功后,DeepMind内部专门成立了一个攻坚小组,利用Transformer推翻重构了AlphaFold 2,并逐步融入生物学专业知识。


但早期的AlphaFold 2性能相比AlphaFold 1还有所下滑,这也一度让他们害怕方向是否存在错误。于是在这个阶段他们采取一种交替模式——


一方面尝试将旧系统性能压榨到极限,一方面给予新系统的研发团队自由试错的空间:允许短期的性能下降,只求不断尝试各种新想法。


80后诺奖得主:AlphaFold下一步融合大模型


直到某一天奇迹发生,它突然变得非常之好。


那天早上,团队其中一个成员上班打开电脑,突然发现AlphaFold 2在某一组蛋白质上表现出奇地好,预测的结构精度达到了1.5埃,大约相当于一个原子的宽度。


但她的第一反应不是兴奋,而是害怕,因为结果好到让她确信自己犯了错误,于是接下来几天她和团队成员一起试图找出错误原因。


结果事实上,这里没有错误——换言之,新系统成功了


80后诺奖得主:AlphaFold下一步融合大模型


于是他们参加了CASP 14竞赛,并集中精力攻克了一个名为ORF8的SARS-CoV-2冠状病毒蛋白。


其结果让人震惊,准确性均分从原先的60+/100,提升至92.4/100,而此前其它方法还停留在40分左右。


至此,这个困扰学界50余年的重大挑战——蛋白质折叠问题终于得到了解决方案。


而在取得突破之后,DeepMind更是将AlphaFold的代码全部开源,并向全世界免费发布了2亿个蛋白质的结构预测数据。


AlphaFold的出现,标志着生物化学领域正式向AI智能发展,也让哈萨比斯和John Jumper获得了2024年的诺贝尔化学奖。


80后诺奖得主:AlphaFold下一步融合大模型


诺奖组委会是这样评价这份工作的:




但在此之前,John Jumper接受采访时曾谦逊地表示,自己的获奖概率只有10%,他更多的是期待能有越来越多科学家利用AlphaFold实现医学和生物学的突破。


80后诺奖得主:AlphaFold下一步融合大模型


而现在,他对自己未来的规划是:


作为年轻的诺奖得主,这让我感到担忧。接下来我将尝试做一些深入研究的小事情,而对于第二次冲击诺贝尔奖,我认为那是个陷阱。


参考链接:

[1]https://www.technologyreview.com/2025/11/24/1128322/whats-next-for-alphafold-a-conversation-with-a-google-deepmind-nobel-laureate/

[2]https://www.nature.com/articles/d41586-025-03886-9

[3]https://deepmind.google/blog/revealing-a-key-protein-behind-heart-disease

[4]https://deepmind.google/blog/breeding-healthier-and-stronger-honeybees/

[5]https://www.youtube.com/watch?v=d95J8yzvjbQ

[6]https://x.com/GoogleDeepMind/status/1993350293703016451

[7]https://mp.weixin.qq.com/s/NenjAUac6mVKrs0ji6C-og

[8]https://fortune.com/2020/11/30/deepmind-solved-protein-folding-alphafold


文章来自于微信公众号 “量子位”,作者 “量子位”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/