摘要
本发明公开了一种基于图表征的多组学癌症样本表示方法及相关装置,表示方法包括:获取基因公共库数据;对基因公共库数据处理,得到癌症样本的方差大于阈值的基因表达数据以及甲基化数据;将癌症样本的方差大于阈值的基因表达数据以及甲基化数据处理后,得到癌症样本的多组学数据,癌症样本的多组学数据取交集,得到公共基因;基于公共基因,通过蛋白质互作网络数据库,得到对应基因的基因互作网络,过滤掉基因互作网络中的部分散点并整合后,得到样本基因互作网络骨架;将癌症样本的多组学数据与样本基因互作网络骨架表示采用样本图表示算法进行整合。本发明对多组学数据进行处理,获得与癌症发生高度相关的基因对应的组学数据,从而减少了测量和测序数据中的实验偏差对后续结论的影响。