摘要
本申请公开了一种模型训练方法、计算机、存储介质及程序产品,方法包括:根据第一提示文本、以及每个评价维度的第一文本和第二文本,构建得到每个评价维度的第二提示文本;将所述第二提示文本输入第一模型,得到隐藏层输出的多个第一向量;根据多个第一向量,确定每个评价维度的第二向量;根据所述第二向量,对所述第一模型的隐藏层进行参数调整,得到第二模型。通过构建提示文本和对隐藏层参数直接进行调整的方式,避免了端到端微调中基于大规模标注数据对模型全参数进行优化的低效率问题,提高模型在回复话术安全性控制上的效率。