一种基于数据标注协同的问答智能体模型训练方法及系统
申请号:CN202511157264
申请日期:2025-08-19
公开号:CN120653996B
公开日期:2025-10-24
类型:发明专利
摘要
本发明提供了一种基于数据标注协同的问答智能体模型训练方法及系统,属于模型训练的技术领域,方法包括对历史训练集、外循环优化数据以及分级标注数据进行数据集整理;将增量数据集对待训练问答智能体模型进行模型参数优化;基于优化模型参数进行模型部署与场景适配;基于模型API端点对模型进行测试与评估;从优化建议中提取得到优化参数,并基于评估分数进行模型上线与运营;将优化参数、分级数据包替换外循环优化数据、分级标注数据进行数据集整理过程,直至输出目标模型,将目标模型运用到问答智能体中,本发明可避免资源浪费并提升模型优化效能,以此提升政务事项智能问答的实时性、有效性以及准确性。
技术关键词
智能体模型
场景特征
数据
端点
训练集
时间统计方法
优化效能
更新模型参数
矩阵
模型预测值
密度
置信度阈值
训练系统
因子
处理器
样本
日志
聚类