摘要
本发明公开了一种基于大语言模型的生成化学空间虚拟筛选方法,属于面向生成化学空间虚拟筛选的技术领域,其技术要点是:包括以下步骤:确定筛选的目标靶蛋白;获取其中分子真实的结合亲和力;根据真实结合亲和力数据训练一个基于图神经网络的代理模型以预测亲和力值;从当前集合中选择一批分子作为生成器的参照;生成器围绕参照物通过提示工程的方式生成一批新的分子;使用图神经网络代理模型预测分子的结合亲和力;根据预测值选择一批分子;获取分子的真实结合亲和力;使用生成器参照生成一批新的分子;重复直到找到了满足特殊条件的分子,具有克服现有方法无法逃离预定义化合物库的缺陷,以及无法通过实时反馈指导虚拟筛选方向的优点。