今天,DeepMind又发布了Alpha模型家族的新成员,堪称是「专精版」的AlphaFold,专注于设计蛋白质结合剂,将大幅减少所需的实验室工作,提升开发效率。
DeepMind「阿尔法」家族,再迎新贵。
谷歌开发者负责人Logan昨日的一句话,勾起了全网好奇心。
「如果你认为AI进展正在放缓,那就说明,你并没有密切关注它」。谷歌究竟有着什么大事,等着我们?
刚好今天,谷歌DeepMind祭出了AI设计蛋白的新模型——AlphaProteo,再次在AI圈里掀起海啸级地震。
它可以为不同的目标蛋白,设计新的蛋白结合剂,能够为癌症、糖尿病并发症相关的VEGF-A。
这也是,AI工具首次能够为VEGF-A,设计出成功的蛋白结合剂。
在7种靶标蛋白测试中,AlphaProteo比现有的方法,实现了3-300倍的蛋白结合亲和力。
它还大幅提升了研究效率,将实验室数年工作,压缩至几天甚至是几周之内。
AlphaProteo的意义在于,可以预防病毒感染,设计抗癌,等各种治愈疾病的药物。
通过蛋白结合剂紧密附着在「病毒」、「癌细胞」上,阻止它们之间的信号传递,扰乱其功能,最终走向死亡。
网友们纷纷感慨道,AI+生物学又一次突破,对于挽救人类生命来说意义重大。真不知道,医疗保健在未来5-10年,会是什么样子?
在AI4Science上,谷歌DeepMind只会投入更多。
「阿尔法」家族的进阶
今年5月,DeepMind刚刚发布了AlphaFold 3,能够以前所未有的原子级精度,预测所有生物分子的结构和相互作用,登上Nature头版。
AF3的诞生,意味着将会开启更多变革性的科学研究,比如基因组学研究、加速药物设计、新材料开发、培育作物等等。
要知道,2020年发布的AlphaFold 2已经引起了科学界的轰动。
由于在蛋白质结构预测上取得了根本突破,全球目前有数百万研究人员使用AF2来研制疫苗、治疗癌症或设计蛋白酶。
而走出「蛋白质世界」,能够预测所有生物分子的AF3,预计会给各领域的科学发现带来更大的变革。
尽管AlphaFold系列模型已经取得了这些成就,团队领导人John Jumper还是经常被「催更」。
比如,有人希望扩展AlphaFold的预测功能,直接针对能改变蛋白质功能的修饰,让模型更好地辅助药物设计、疾病理解等领域。
虽然Jumper在采访中经常表示「很无奈、做不到」,但DeepMind显然看到了这一层需求。
最新发布的模型AlphaProteo,就是瞄准了这些领域的实际应用,旨在设计出能成功结合目标分子的蛋白质。
博客地址:https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/
学习蛋白质的相互结合
从细胞生长到免疫反应,人体的每一个生物过程都依赖于蛋白质的之间的相互作用。
蛋白质的结合具有一个重要性质——特异性,就像钥匙和锁。「锁齿」对不上,蛋白质就无法结合并发挥作用。
关于这类过程的原理和机制,AlphaFold等结构预测工具可以为我们提供很多见解,但还不能创造出新的蛋白质来直接操纵这些相互作用。
想创造出能结合目标分子的蛋白质,这项工作目前还只能交给科学家完成。
这类「蛋白质结合剂」可以加速许多领域研究的进展,包括药物开发、细胞和组织成像、疾病理解和诊断,甚至是提升作物抗虫性。
尽管机器学习方法在蛋白质设计方面取得了重大进展,但这一过程仍然繁琐且复杂,传统方法耗时费力。
不仅设计过程本身难度很大,需要多轮的广泛实验测试;结合剂被成功制造出来之后,还需要进行额外的实验来优化结合亲和力,以便能和目标蛋白结合得足够紧密、发挥作用。
而今天推出的AlphaProteo就是专门用于设计高强度蛋白质结合剂, 有助于药物发现、开发生物传感器等应用
实验发现,AlphaProteo适用于多种目标蛋白,比如与癌症和糖尿病并发症相关的VEGF-A,这是AI工具首次为VEGF-A成功设计出蛋白结合剂。
此外,在测试的其他7种目标蛋白上,相比之前的最佳方法,AlphaProteo的实验成功率更高,且蛋白质的结合亲和力有3~300倍的提升。
团队同时放出了一篇论文,详细介绍了湿实验的流程与验证结果。
论文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/Protein_Design_White_Paper_2024.pdf
AlphaProteo的训练数据包括Protein Data Bank(PDB)和AlphaFold生成的超过1亿个预测结构。
通过训练,AlphaProteo学习到了蛋白质分子相互结合的方式。给定目标分子的结构以及优先结合位点,模型就能生成在相应位点结合的候选蛋白质。
预测的蛋白结合剂与目标蛋白质相互作用的示意图,蓝色部分为AlphaProteo生成的蛋白结合剂结构,黄色部分为目标蛋白质,即SARS-CoV-2刺突受体结合域
但遗憾的是,博客和文章都没有提到AlphaProteo的模型架构或具体训练方法,目前也没有放出代码或模型权重。
成功结合关键蛋白
为了测试AlphaProteo,团队在7种目标蛋白质上进行了测试,包括:
- 2种与感染有关的病毒蛋白:BHRF1和SARS-CoV-2刺突蛋白受体结合域SC2RBD
- 5种与癌症、炎症和自身免疫性疾病有关的蛋白质:IL-7Rɑ、PD-L1、TrkA、IL-17A和VEGF-A
结果显示,AlphaProteo具有极高的结合成功率和同类最佳的结合强度。
它成功地在计算机模拟中生成了候选蛋白质,并在实验中实现了与目标蛋白质的紧密结合。
AlphaProteo为以上7种蛋白质生成了结合剂,蓝色是在湿实验室中测试的结合剂示例,黄色部分是目标蛋白质,深黄色部分突出显示了预期的结合区域
对于病毒蛋白BHRF1,候选分子成功结合的比例高达88%,比现有的最佳设计方法高出10倍。
候选蛋白的结合成功率提高,意味着需要更少的测试,就能找到成功的结合剂,可以大大缩短实验周期,降低研发成本。
AlphaProteo对7个目标蛋白质的输出结果在体外实验中的成功率
对于另一个目标蛋白TrkA,AlphaProteo设计出的结合剂甚至胜过了先前最佳的、经过多轮实验优化的结合剂。
在没有实验优化的情况下,AlphaProteo对7个目标蛋白质设计结果的最佳亲和力,较低的亲和力意味着与目标蛋白结合得更紧密
验证结果
除了自己开展的实验,DeepMind还邀请了英国王牌研究中心、欧洲最大的生物医学研究机构——弗朗西斯·克里克研究所(Francis Crick Institute)来进行验证。
在不同的实验中,团队更深入地研究了两种目标蛋白,SC2RBD和VEGF-A的结合剂。
结果显示,这些结合剂的结合相互作用确实与AlphaProteo的预测相似,并且具备有效的生物功能。
例如,SC2RBD的蛋白结合剂被证明可以阻止SARS-CoV-2及其部分变种对细胞的感染。
然而,由于AI的局限性,AlphaProteo对一种目标蛋白无能为例,即与类风湿性关节炎等自身免疫性疾病相关的TNFɑ。
但值得注意的是,计算分析显示针对TNFɑ设计结合剂极具挑战性,而这也是DeepMind用它来进行测试的原因。
通常来说,实现强结合只是设计蛋白质结合剂的第一步,在研究和开发过程中还有许多生物工程障碍需要克服。
而AlphaProteo可以大幅减少初步实验所需的时间,并适用于广泛的应用。
蛋白设计是一项快速发展的技术,在多个领域都具有很大的科学潜力,比如理解疾病的致病因素、在病毒爆发中加速诊断测试的开发、支持可持续的制造工艺,甚至清除环境污染物等方面。
DeepMind提出,未来不仅会与学界合作,利用AlphaProteo解决具有影响力的生物学问题并了解其局限性,而且还会和Isomorphic Labs合作,探索药物设计方面的应用。
同时,团队还将将继续提高AlphaProteo算法的成功率和亲和力,扩大其可以解决的设计问题范围,并与机器学习、结构生物学、生物化学和其他学科的研究人员合作,开发出负责任且更全面的蛋白设计方案。
参考资料:
https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/
文章来源“新智元”,作者“新智元”
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda