一种大语言模型测试数据集生成方法、系统、设备及介质
申请号:CN202411104009
申请日期:2024-08-13
公开号:CN119046424A
公开日期:2024-11-29
类型:发明专利
摘要
本申请公开了一种大语言模型测试数据集生成方法、系统、设备及介质,涉及自然语言处理领域,该方法包括:多个对话智能体基于提示语生成对话链:每个对话智能体根据提示语生成回答,并对其他对话智能体生成的回答进行质疑和评分,根据其他智能体给出的质疑和评分重新生成回答,最终将评分最高的回答作为最优回答;关键词提取智能体和关键词判断智能体基于提示语及最优回答生成判断链:关键词提取智能体从最优回答中提取关键词集合,关键词判断智能体对关键词集合进行质疑,关键词提取智能体根据质疑重新提取关键词集合,最终得到最优关键词集合;将提示语、最优回答及最优关键词集合存入数据库。本申请提高了大语言模型测试数据集的生成效率。
技术关键词
关键词
大语言模型
生成方法
生成系统
数据
处理器
自然语言
计算机设备
存储模块
可读存储介质
存储器
代表
仓库
记忆