摘要
本发明公开了一种基于微调和进化算法的蛋白质大语言模型优化方法,涉及计算机技术领域。该方法包括:通过蛋白质大语言模型的待优化参数集中不同参数组合对Qwen2‑7B模型进行微调,并进行测试,得出蛋白质大语言模型的准确率数据;对人工神经网络进行训练得到代理模型;获取多个初始参数组合作为初始种群,并根据代理模型确定初始种群对应的蛋白质大语言模型的准确率;将准确率作为进化算法的适应度值,对初始种群执行进化操作,生成多个新的待优化参数组合作为新的参数种群,并进入进化算法的下一轮进化操作,直至达到进化算法的停止条件;将适应度值最高的参数组合,确定为蛋白质大语言模型的最优参数组合。该方法能够提升蛋白质大语言模型的预测精度。