“对于罕见病患者而言,有药可用永远都是第一位的。”
中国国际经济交流中心理事长毕井泉曾于2022年这样说。
罕见病,顾名思义,是患病率相对较低的一类疾病。由于患病人数少、市场需求小,以及药物研发难度大、成本高、周期长,罕见病治疗难度居高不下,罕见病用药更被称为“孤儿药”。绝大多数罕见病患者都面临着治疗困难、药物短缺的问题。
据世界卫生组织(WHO)报道,在全球发现的超过7000种的罕见病中,有获批的相应治疗方案或药物的病种不到10%,且大多需要终身药物治疗。在这一严峻背景下,如何为罕见病寻求有效治疗药物是缓解罕见病患者治疗困境的关键一步。
这一步,在人工智能(AI)的帮助下有望向前迈出“一小步”。
日前,来自哈佛医学院的研究团队及其合作者开发了一个名为TxGNN的AI模型,这是首个专门为识别罕见疾病和无药可治病症的候选药物而开发的新办法,它从现有药物中确定了17000多种疾病的候选药物,其中许多疾病没有任何现有治疗方法。与用于药物再利用的同类AI模型相比,TxGNN在识别候选药物方面平均提高了近50%,在预测哪些药物会有禁忌症方面,准确率也高出35%。
相关研究论文以“A foundation model for clinician-centered drug repurposing”为题,已发表在Nature子刊Nature Medicine上。
传统的药物再利用(drug repurposing)策略,虽然利用现有药物的安全性和有效性数据,可以加快新药物在临床中的应用,但这种方法往往是偶然的且机会性较强,很难系统地解决罕见病的药物研发问题。
在这种背景下,TxGNN应运而生,为药物重新利用带来了革命性的突破,特别是在罕见病药物发现中展现出巨大的潜力。
TxGNN是一种基于图神经网络(GNN)的基础模型,专门用于零样本药物再利用。与传统方法不同,TxGNN并不局限于现有药物和疾病的已知关系,而是通过训练一个医学知识图谱(KG),将疾病和药物之间的复杂关系嵌入到一个潜在的表示空间中,从而能够针对任何给定的疾病预测潜在的治疗药物。该知识图谱包含了17080种疾病、7957种药物、27671种蛋白质等医学概念,为TxGNN的训练提供了丰富的数据基础。
图|TxGNN是药物再利用的图基础模型,可为治疗选择有限且分子数据有限的疾病确定候选药物。(来源:该论文)
在多次实验中,TxGNN展现出了其强大的预测能力。与8种现有的方法进行对比,TxGNN在零样本环境下表现出了显著的优势。根据论文中的实验数据,TxGNN在药物指征预测的准确率上提高了19%,在副作用预测上提高了23.9%。
这些结果表明,TxGNN不仅能够在现有治疗方案中找到潜在的新用途,更能够在没有已知治疗方案的情况下,准确地预测出可能的药物。这对于罕见病的治疗具有重要意义,因为罕见病中超过95%没有现有的治疗药物,而TxGNN为这些疾病快速发现新药物创造了可能性。
图|TxGNN可准确预测药物适应症和禁忌症。(来源:该论文)
除了预测能力,TxGNN还特别设计了一个解释模块,用于帮助医生和研究人员理解模型的预测逻辑。这个模块通过多条路径(multi-hop paths),展示了药物与疾病之间的潜在联系。
解释模块不仅能够指出某种药物为何对特定疾病可能有效,还能提供详细的医学知识路径,让使用者能够追溯到预测背后的科学依据。通过这项功能,TxGNN克服了许多AI模型在医学应用中的“黑箱问题”,大大提高了模型的可解释性和信任度。
图|TxGNN Explainer中多条可解释路径的开发、可视化和评估。(来源:该论文)
研究团队对TxGNN在罕见病药物发现中的实际应用进行了验证,并取得了令人鼓舞的成果。在实验中,TxGNN的许多预测与实际的临床非处方药物使用具有高度一致性。
例如,在对1272085名患者的电子病历数据分析中,研究人员发现,TxGNN预测的顶级药物在这些患者群体中的使用频率显著高于随机预测。log(OR)(共现比值)的分析显示,TxGNN预测出的药物与罕见病的使用关联性比底层药物预测高出107%,进一步证明了该模型在实际临床环境中的有效性。
图|在大型医疗系统中评估TxGNN的预测结果。(来源:该论文)
一个具体的案例是,TxGNN在预测Wilson病(一种导致铜代谢异常的罕见病)的潜在治疗药物时,推荐了去铁酮(Deferasirox)作为最有前途的候选药物。该药物在临床中已被用于治疗铁超载疾病,TxGNN通过其解释模块展示了去铁酮可能通过代谢途径对Wilson病的治疗产生积极作用。这一预测也与医学文献中的相关研究结果相符,显示了该模型的科学合理性。
在当前药物开发周期漫长、成本高昂的背景下,TxGNN为现有药物的重新利用提供了系统化的解决方案。
未来,随着这一技术的不断完善,它有望成为加速药物开发、特别是使罕见病患者“有药可用”的关键驱动力。
除罕见病领域,AI在其他医学领域也有着广泛的应用。
2019年9月,AI药物研发公司Insilico Medicine开发了一个名为GENTRL的生成式AI平台,该平台已用于设计用于治疗纤维化和癌症等疾病的新药。通过使用GENTRL,研究人员仅使用21天就发现了盘状蛋白结构域受体1(DDR1)的强效抑制剂,极大缩短了药物发现时间。
2022年,伦敦癌症研究所的研究人员创建了一个原型测试,可以在24-48小时内预测哪些药物组合可能对癌症患者有效。他们使用AI分析来自肿瘤样本的大规模数据,可以比目前的方法更准确地预测患者对药物的反应。
2023年,美国公司Nuance Communications推出一款新型AI驱动的语音激活软件应用程序——Dragon Ambient Experience(DAX)Express。该计划旨在通过利用自然语言处理技术,促进患者咨询期间医疗记录的实时转录,有效帮助减轻临床医生的管理负担。
2024年,来自哈佛医学院的研究团队及其合作者提出了临床组织病理学成像评估基础(CHIEF)模型,用于提取病理成像特征以进行系统的癌症评估。在包含11种癌症类型的15个数据集上,CHIEF在癌症检测方面实现了近94%的准确率,显著优于之前的AI方法。
毋庸置疑,AI在改善罕见疾病检测、药物再利用以及临床流程优化方面的潜力将会越来越大,能够更好地帮助我们更好地抗击疾病。
文章来自于微信公众号:学术头条 ,作者“阮文韵”