AlphaFold2解决了很大程度上解决了单体蛋白质结构预测问题。
为什么新发布的AlphaFold3,称能以前所未有的精度预测所有生命分子的结构和相互作用,但却没有引发AlphaFold2一样的轰动呢?
主要原因是蛋白质相互作用(PPI)的数据实在太少了。
最新的结合亲和数据集 (PDBbind+) 只有 3,176 个蛋白质,相比较PDB收录的蛋白质/核酸结构超20万个。
初创公司A-Alpha Bio有望通过AI+合成生物学+NGS(下一代测序)的方式来突破这一困境。
公司称拥有世界上最大的蛋白质相互作用数据集AlphaSeq,包含了超过7.5亿条测量结果,并且每个月以3M~50M数据点的速度快速扩展。
目前,A-Alpha Bio 已经获得超过6000万美元的融资和赞助,并和世界上顶尖药企和机构展开合作,包括BMS、吉利德、安进、劳伦斯·利弗莫尔实验室等。
尽管AI是非常重要的标签,倒不如说A-Alpha Bio 本质上是蛋白质工程学上的创新。
A-Alpha Bio来头不小, 2017 年在华盛顿大学蛋白质设计研究所和合成生物学中心成立。
创始人是华盛顿大学的两名博士 David Younger 和 Randolph Lopez 。
其中 David Younger 来自著名的华盛顿大学蛋白质研究所David Baker实验室。
而Randolph 则是华盛顿大学生物工程学博士,在读博士之前他还曾是 Illumina 的工艺开发工程师,背景决定了两位在工程学和算法上都有较深的造诣。
被喻为“上帝之手”,享誉世界的生物计算大牛David Baker担任公司顾问。
公司技术源于David Younger发表的一篇论,介绍了对PPI数据进行大规模收集和表征的基本方法,该方法被称为“AlphaSeq”。
正常酿酒酵母的中,MATa单倍体细胞与MATα单倍体细胞,能够相互找到彼此并融合形成二倍体细胞,再减数分裂称为单倍体。
这个过程被称为酵母的“交配”,主要通过表面的蛋白质相互作用来完成。
利用这个过程,A-Alpha Bio通过酵母展示技术(Yeast display)酿酒酵母细胞进行基因工程改造,让其在其表面显示感兴趣的蛋白质。
于是当MATa细胞表达一种蛋白质,MATα细胞则表达另一种蛋白质。当混合这些细胞时,它们交配的可能性则显示了蛋白质相互作用强度。
但是,如何测量数千或数百万个蛋白质对中的这些相互作用呢?
答案是 DNA编码文库。酵母表面显示的每种蛋白质都与一个独特的 DNA 条形码相关联。
当两个酵母细胞交配时,这些条形码会配对到一条 DNA 链上。如果蛋白质-蛋白质相互作用越强,那么观察到新条形码的频率会更高。
创始人称,公司每月执行大约 30 次 AlphaSeq 检测,每次检测的交叉面100k~5M。也就是说,每月新增 30M-150M 个数据点!
不过,酵母作为一个平台也存在非常大的限制。具体来说,因为它不能概括与人类细胞中相同的翻译后修饰,这可能会影响表达蛋白质的折叠,从而影响结合。
根据创始人称,阻止AlphaSeq进一步扩大有2个限制因素:酵母相互匹配的程度,以及NGS测序的覆盖率。
显然,以上还只是A-Alpha Bio生成PPI数据库的过程,那么又如何用于药物研发呢?
每个新的 AlphaSeq 实验的数据都会被添加到一个不断增长的数据库中,该数据库包含数亿个蛋白质-蛋白质相互作用亲和力测量值,包括阴性数据。
这些数据用于训练将蛋白质序列与结合亲和力的AI模型AlphaBind,然后使用表达、稳定性、溶解度和其他特性的计算工具筛选和设计药物。
从管线布局上看,A-Alpha Bio的平台主要开发免疫细胞因子和分子胶药物,但所有都处于临床前早期研发阶段。
尤其是在分子胶领域,A-Alpha Bio拿下了和安进、BMS、Kymera Therapeutics 的合作。
与抑制蛋白质功能的传统药物不同,分子胶的工作原理诱导或增强两种蛋白质之间的相互作用,导致靶蛋白降解。
因此开发分子胶药物的一大痛点在于能够测量靶点和连接酶之间的相互作用。而AlphaSeq非常适合通过发现和表征 E3 泛素连接酶与靶蛋白之间的弱相互作用来发现分子胶的新靶标。
在Dyno Therapeutics的高级机器学习工程师Abihishaike Mahajan看来,A-Alpha Bio的用武之地在于,他们是唯一能够针对许多靶蛋白筛选许多 E3 连接酶的团队。
也就是说,公司与制药公司的合作,不是自己开发治疗方法,而是帮助合作伙伴筛选和帮助研发。
通过测试E3 连接酶文库和不可成药的靶蛋白之间的相互作用,为开发分子胶提供起点。
不过目前除了少数的几篇论文外,A-Alpha Bio 还没有能够证明其大规模积累蛋白质相互作用的论文。
但公司手握多个大型制药公司的合作,足以证明A-Alpha Bio的发展潜力。
文章来自于“智药局”,作者“智药局”。
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda