模型样本的质量评估方法、装置、存储介质和计算机设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
模型样本的质量评估方法、装置、存储介质和计算机设备
申请号:CN202411104070
申请日期:2024-08-13
公开号:CN119167100A
公开日期:2024-12-20
类型:发明专利
摘要
本申请公开了一种模型样本的质量评估方法、装置、存储介质和计算机设备。方法包括:将样本数据输入人工智能生成内容检测模型,获取样本数据的命中概率;基于样本数据的属性信息匹配内容评估体系;基于内容评估体系中评价规则对样本数据进行处理,确定样本数据相对于至少一个预设评价指标的测试值;基于与命中概率和预设评价指标对应的目标权重,对命中概率和测试值进行权重计算,得到样本数据的质量评分。本申请的方法能够过滤了那些由AI生成但可能误导模型训练的数据,还显著提升了样本数据集的纯净度和可信度,还能够实现对训练数据的多维度、高精度评估,满足不同的任务需求,提升基于样本数据训练的模型的泛化能力和对未知数据的适应能力。
技术关键词
样本 内容评估 指标 计算机设备 人工智能模型 主题 处理器 评估装置 文本 自然语言 匹配模块 数据格式 语义 可读存储介质 程序 算法 节点 水印