任务处理模型评测方法、角色扮演模型评测方法及任务处理方法
申请号:CN202511215549
申请日期:2025-08-28
公开号:CN120744423A
公开日期:2025-10-03
类型:发明专利
摘要
本说明书实施例提供任务处理模型评测方法、角色扮演模型评测方法及任务处理方法,其中所述任务处理模型评测方法包括:获取模型评测数据,其中,模型评测数据包括任务数据、任务结果以及模型结果,模型结果为任务处理模型对任务数据进行预测得到的结果;解析任务数据,获得任务数据对应的思维路径,其中,思维路径用于描述任务结果的结果特征;根据思维路径,对任务数据、任务结果以及模型结果进行互信息分析,获得任务处理模型的模型评测结果。思维路径提供了模型评测过程的可解释依据。基于思维路径进行互信息分析,可以揭示任务处理模型的任务并识别任务处理模型在推理路径上的可能偏差或错误模式,有效评测了任务处理模型的泛化能力与稳定性。
技术关键词
概率生成模型
模型评测方法
数据
样本
指标
场景
模型库
终端设备
存储计算机程序
处理器
参数
指令
接口
存储器
计算机程序产品
平台
标识
误差
可读存储介质
电子设备