Nature重磅!哈佛发布AI蛋白质模型,98%准确率力压谷歌团队,精准揪出“致病基因”!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Nature重磅!哈佛发布AI蛋白质模型,98%准确率力压谷歌团队,精准揪出“致病基因”!
8978点击    2025-11-28 11:42

罕见病诊断一直是医学界的难题。


传统方法存在着检测流程复杂、报告解读困难等问题,约半数患者因缺乏明确病因治疗受阻。


近日,《Nature Genetics》期刊上发布了一项名为“Proteome-wide model for human disease genetics”的研究,哈佛医学院和巴塞罗那基因组调控中心(CRG)的研究人员开发出一款名为popEVE的AI蛋白质模型。


Nature重磅!哈佛发布AI蛋白质模型,98%准确率力压谷歌团队,精准揪出“致病基因”!


该模型是一款结合进化信息和人类群体数据的深度生成模型,能在全蛋白质组范围内评估变异的有害程度。有望彻底改变遗传疾病的诊断方式。


为验证模型效能,团队分析了超过3.1万个患有严重发育障碍的儿童家庭遗传数据。


在98%的病例中,popEVE将共同突变标记为最具破坏性的变异,其表现优于谷歌DeepMind团队AlphaMissense在内的同类工具。


与此同时,popEVE还发现了123个此前被认为与发育障碍无关的基因,其中104个仅在个别病例中出现。


能判断“严重程度” 无需父母数据


早在2021年,该团队就发表了变异效应进化模型EVE,当时该模型就能将人类疾病基因中的突变分类为良性或有害,但其分数无法直接在基因间进行比较,并确定哪种对健康影响最为严重。


而新推出的popEVE在大型语言蛋白质模型实现提升的基础上,结合了来自英国生物样本库内的海量人类数据,实现了AI辅助罕见病诊断的全新突破。


在测试中,该模型不仅能区分致病变异和良性变异,还能识别出健康对照组,平均精度比次优模型(AlphaMissense)提升3.2%。并且该模型能仅凭儿童基因组识别可能的因果变异,无需父母数据


popEVE最大的突破,还是实现了对“严重程度”的判断


Nature重磅!哈佛发布AI蛋白质模型,98%准确率力压谷歌团队,精准揪出“致病基因”!

popEVE的示例输出。左侧和中间面板显示了图表和列表格式的变异分数,从最可能致病的深紫色到最不可能的黄色。右侧面板描绘了带有变体分数的蛋白质晶体结构。图片来源:Marks实验室


在临床情况下,一些蛋白的功能受损可能在晚年产生适度影响,而另一些蛋白的破坏在儿童期可能致命。


这两种情况都可以被视为“致病”,但在试图找出严重疾病的遗传原因时,模型必须能够区分这两种情况。


力压DeepMind 不止罕见病诊断 


2023年,开发出AlphaFold的谷歌DeepMind团队开发了一款名为AlphaMissense的模型,作为AlphaFold的一种改进衍生工具,实现对错义突变的致病性预测。


该模型以接近89%的准确率一鸣惊人,推开了AI模型辅助诊断遗传疾病的大门。


然而,开发了popEVE的哈佛团队认为,虽然AlphaMissense在蛋白质稳定性方面准确,但缺乏诊断所需的临床校准。


统计分析显示,AlphaMissense预测平均每个人会有五种“致病”变异,而popEVE预测不到一种。这种差异在临床环境中至关重要,因为过度预测可能导致误诊和不必要的焦虑。


尽管性能有所提升,popEVE仍是一个研究工具尚未获得FDA批准作为独立诊断设备使用,目前已开源且可以通过在线门户直接访问使用。


Nature重磅!哈佛发布AI蛋白质模型,98%准确率力压谷歌团队,精准揪出“致病基因”!

在线门户:https://pop.evemodel.org/

开源链接:https://github.com/debbiemarkslab/popEVE


据悉,该模型未来的应用不仅限于诊断,还将扩展到药物发现,因为该模型能够精确定位蛋白质结构中的特定致病机制。


文章来自于“智药局”,作者“向然”。

AITNT-国内领先的一站式人工智能新闻资讯网站