一种社交大语言模型测评方法、系统、设备和存储介质

申请号：CN202411577057

申请日期：2024-11-06

公开号：CN119398032A

公开日期：2025-02-07

类型：发明专利

摘要

本申请公开了一种社交大语言模型测评方法、系统、设备和存储介质，方法包括：根据业务场景对社交大语言模型能力进行拆解和收集客观测评数据集；针对客观测评数据集中的各类题目构建不同人设背景的prompt，通过客观测评数据集对社交大语言模型进行客观测评，获取社交大语言模型的客观测评结果；与社交大语言模型进行模拟会话，根据社交大语言模型的会话输出进行模型情感满足度、人设一致性、回答连贯性以及风格显著性方面的评价，获取社交大语言模型的主观测评结果；根据社交大语言模型的客观测评结果和主观测评结果输出测评报告。本申请改善了现有技术测评内容过分集中在模型的知识理解方面，对用户体验不关注，测评内容不全面的技术问题。

技术关键词

大语言模型社交测评方法测评系统会话存储程序代码风格数据收集模块档位可读存储介质报告处理器职业场景输出模块年龄存储器计算机电子设备

系统为您推荐了相关专利信息

大小模型协同中药方剂优化方法、系统、终端及存储介质

大语言模型中药方剂药效药材溯源计算机可执行指令

视频会议密钥协商方法、视频会议平台、设备及程序产品

密钥协商算法密钥协商方法加密算法终端视频会议平台

基于互动语言的素材推送方法及装置

偏好特征素材推送方法标签矩阵元素

一种基于情景感知的多模态抑郁症检测系统

抑郁症检测系统社交互动分析心理健康子模块情景

一种业务应用快速抽象建模方法及装置

建模方法案例库置信度阈值场景大语言模型