摘要
本发明属于医学辅助诊断领域,具体的说是基于HE病理图像预测肺腺癌基因突变的模型和方法,该诊断方法包括如下步骤:数据收集,收集来自TCGA、CPTAC、GTEx公开数据库中的H&E染色数字病理全切片图像,构建病理切片预训练数据集,收集来自多个医院中心的H&E染色肺癌WSIs及其关键基因突变情况,构建的肺癌‑基因突变数据集、预处理、实例特征提取模型构建与训练、实例特征聚合模型构建与预测、模型验证与评估,本发明通过对苏木精‑伊红(Hematoxylin‑Eosin,H&E)染色的肺癌病理全切片图像(WholeSlideImages,WSIs)进行分析,以有效预测出EGFR、KRAS、TP53等关键基因突变。提供了一种更加快速、经济且有效的替代方案,可以有效克服现有基因测序技术耗时长和成本高的局限性。