病理诊断,是AI改变医疗的关键环节。
近年来,癌症诊断需求不断增长,随之而来的是病理科巨大的供给挑战。
信息显示,我国病理医生缺口巨大,且分布极不均衡,大部分集中在三甲医院,二甲及以下医院的病理医师严重缺乏且经验不足。
而AI尤其是大模型的引入,为解决这一挑战带来希望。
7月16日,AI病理学公司Paige联合微软推出病理学多模态基础模型PRISM2,通过结合病理图像与临床语料,为癌症诊断、生物标志物预测等多个领域带来深刻变革。
PRISM2基于超过230万张全切片图像进行训练,涵盖数十万例患者病例,且每张图像都配有对应的临床报告,帮助模型理解真实的诊断语言,提升其在不同人群、组织类型和癌症类型中生成有价值判断的能力。
测试结果显示,PRISM2在各个任务中的表现均优于其他切片级基础模型,而其创新性的零样本(zero-shot)方法,使得模型能够更好地应对各种罕见疾病或新型生物标志物,即使这些样本在训练数据中很少甚至没有出现过。
同时,PRISM2引入了大语言模型,能够即时生成简洁、符合临床标准的报告,大大减少了工作量,成为医生和研究人员们真正的合作伙伴。
PRISM2的推出,在性能、交互和泛化方面树立了新的行业标准,成为数字病理学和人工智能领域的最新突破。
未来这款模型还将被集成到Paige的下一代生成式AI临床平台Alba中,用户可以在直观的交互式界面中自动执行常规任务、分析病理图像并提供快速的临床洞察。
Paige表示,公司使命是构建智能系统,并将其无缝集成到临床和研究环境中,从而改变癌症的诊断和治疗方式。
近年来,随着数字病理学和人工智能的快速发展,极大提升了癌症诊断的效率。
诸如Virchow2、UNI2和H-optimus-1等模型展示了利用数百万张组织切片进行自我监督学习的强大能力。
然而,尽管这些模型在特定任务上表现出色,但它们未能充分整合临床信息,限制了其在复杂临床场景中的应用潜力。
针对这些问题,Paige联合微软推出新型多模态病理基础模型PRISM2,模型采用了独特的两阶段训练策略。
第一阶段旨在对齐全切片图像(WSI)的视觉特征与临床诊断报告的文本信息。通过大规模数据集(包含近70万份标本和230万张WSI)的对比学习和图像字幕生成训练,模型学习如何将复杂的病理图像与对应的文字描述关联起来,为后续的深度理解打下基础。
第二阶段,解冻语言模型并引入一个40亿参数的LLM,通过模拟真实的临床对话(包括利用GPT-4o生成的问答对),PRISM2 学习在互动语境下理解和生成病理相关语言,从而提炼出对临床决策更有价值的深层特征。
这使得PRISM2不仅能理解病理图像的视觉信息,还能将其与临床诊断报告中的语言信息深度融合,并通过对话训练提升其临床推理和实用性。
测试结果显示,PRISM2在多项病理学任务中展现了强大性能,显著优于前代模型PRISM和哈佛医学院开发的多模态全切片基础模型TITAN。
更为惊艳的是,PRISM2 引入了一种创新的零样本“是/否”分类方法,这使得模型能够对复杂、非预设的问题给出推断性答案,极大地增强了其在实际临床场景中的灵活性和泛化能力。
例如,在PanCancer罕见癌症检测任务中,PRISM2的AUC达到了0.952,优于PRISM的0.947和TITAN的0.931。
这表明PRISM2不仅能够有效识别常见的癌症类型,在面对罕见的病理图像时仍能保持良好的性能。
在高效地从全切片图像中提取关键病理特征的同时,PRISM2还能根据需要结合患者背景信息,形成更加个性化的临床报告,大大减少了医生工作量。
PRISM2的问世标志着通用型AI病理模型的关键一步,在临床实践展现出广泛实用价值,有望显著提升诊疗效果。
Paige联合创始人兼首席科学家Thomas Fuchs是一位在计算病理学和医疗人工智能领域具有全球影响力的专家。
在担任纪念斯隆凯特琳癌症中心(MSK)沃伦·阿尔珀特数字与计算病理学中心主任期间,他领导了一个专注于计算病理学和医学机器学习的实验室,致力于开发分析数字显微镜载玻片的新方法,旨在揭示基因突变及其对组织变化的影响,以绘制癌症的病理学图谱。
2018年,Thomas Fuchs与David Klimstra共同创立了Paige,希望利用深度学习和庞大数据集的力量来彻底改变癌症诊断。
图:Thomas Fuchs(左)与David Klimstra(右)
David Klimstra博士是癌症病理学领域的知名学者,拥有超过三十年的研究生涯,专注于胰腺、肝脏和胃肠道肿瘤的病理学研究。
此前,Klimstra曾担任纪念斯隆凯特琳癌症中心病理学系主任,领导了数字病理学工作流程的评估和实施。
Paige.AI 的核心技术在于其计算病理学平台和AI驱动的应用程序,这些都建立在公司建立的目前规模最大、最多样化的数字病理学数据集之上。
除了癌症检测之外,Paige还面向生命科学、制药公司和研究机构提供解决方案,包括精准的治疗靶向、新型生物标记识别以及优化的临床试验设计。
这背后离不开公司自主研发的一系列基础模型的有力支持,如Virchow和PRISM,通过对大规模计算病理学数据的深入分析,更全面地理解癌症。
目前,Paige已官宣多项外部合作,包括与微软携手开发基础模型、为Lumea、Aiforia等数字病理学企业提供AI解决方案、与Breast International Group加速乳腺癌研究以及与强生推动新型生物标志物检测。
迄今为止,Paige总融资额超过2.41亿美元,投资者包括微软、强生创新-JJDC、KKR、Casdin Capital等知名机构。
当经验医学迈向精准医学,病理诊断作为临床金标准,其意义愈加重要。
从技术视角来看,病理辅助诊断系统是AI在医学检验领域相对成熟的应用场景之一。
但因为病理学图像对数据集质量、储存、算力等资源都有极高的要求,AI病理诊断往往是顶尖院所和大厂的游戏,目前国外病理学模型研究几乎被哈佛与微软垄断。
近年来,中国在AI病理诊断领域取得了显著突破,国内科研机构、医疗机构和科技企业协同发力,展现出强劲的发展势头和创新能力。
2023年9月,透彻未来发布了透彻大脑病理大模型。2024年7月,商汤医疗联合清华大学等科研院所发布了病理大模型PathOrchestra,利用国内规模最大的近30万张全切片数字病理图像(近300TB数据)数据集训练。
今年2月,华为联合上海瑞金医院正式发布瑞智病理大模型RuiPath,这一成果基于瑞金医院病理科百万级数字切片库,覆盖了中国每年90%癌症发病人群罹患的癌种,并且亚专科知识问答深度达到专家级知识水平。
然而,值得注意的是,AI病理诊断在临床转化和规模化落地仍面临诸多挑战,尤其相关的技术标准、审批流程和临床应用规范等领域,仍处于探索阶段。
文章来自于微信公众号“智药局”,作者是“子任”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/