摘要
本发明提供一种基于多视图自编码器的多组学数据缺失插补方法及系统,涉及生物多组学数据技术领域。该方法首先获取疾病相关的多组学数据,并进行预处理;然后针对不同组学数据分别构建专用编码器;并基于各编码器提取的各组学潜在特征表示,引入自注意力机制和交叉注意力机制以增强特征表达能力并实现跨组学特征融合,得到各组学的融合特征表示;然后采用层次化的融合策略,将各组学融合的特征表示进一步整合为统一的潜在特征表示实现信息的深度融合与压缩;最后针对各组学的编码器设计专门化解码器进行原始数据重建;该方法解决了多组学整合中普遍存在的数据缺失问题。