融合大模型语义和接触图信息的蛋白质相互作用预测方法
申请号:CN202510546775
申请日期:2025-04-28
公开号:CN120375916A
公开日期:2025-07-25
类型:发明专利
摘要
本发明属于生物信息领域,涉及融合大模型语义和接触图信息的蛋白质相互作用预测方法。本发明结合了四个关键模块:基于ESM2语言模型的蛋白质序列嵌入、基于AlphaFold的接触图结构表示、图结构构建模块以及基于GCNII的深度图卷积编码模块。通过将蛋白质序列的全局语义表示与结构接触关系进行融合,DGraph‑PPI能够有效捕捉蛋白质间潜在的拓扑依赖与功能关联。相较于现有的基于序列或结构单一信息的预测模型,DGraph‑PPI在多项评估指标上展现出更优的性能,尤其在识别复杂的相互作用模式、处理低序列相似性蛋白质对以及提升泛化能力方面具有显著优势。
技术关键词
蛋白质相互作用预测方法
蛋白质三维结构
sigmoid函数
序列
结构特征提取
语义特征
卷积网络模型
编码模块
深度图
语义向量
矩阵
节点特征
融合特征
优化器
超参数
标记