摘要
本发明涉及一种基于大语言模型的生成式评估系统及方法,该系统包括输入单元和评估单元,评估单元内设置有预先训练好的评估模型,用于对输入单元接收的待评估数据进行评估、并输出结果,该方法包括:收集公开数据集,并针对公开数据集中相关数据进行筛选重构处理、拒绝采样处理以及分类合成处理,构建得到训练数据集;利用训练数据集对大语言模型进行训练,结合SFT损失和策略梯度损失,训练得到评估初始模型;针对评估初始模型进行评分筛选,确定出最优评估初始模型,以作为训练好的评估模型;将当前待评估数据输入训练好的评估模型,输出得到对应的生成式评估结果。与现有技术相比,本发明能够提高评估的准确性、可解释性与泛化性。