基于标注质量和奖励偏差的视频描述方法、系统及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于标注质量和奖励偏差的视频描述方法、系统及介质
申请号:CN202511169416
申请日期:2025-08-20
公开号:CN120980320A
公开日期:2025-11-18
类型:发明专利
摘要
本发明涉及一种基于标注质量和奖励偏差的视频描述方法、系统及介质,方法包括以下步骤:提取目标视频的视频特征;使用层次式视觉网络对视频特征进行编码,得到多级视频编码特征;通过视频描述生成模型将多级视频编码特征解码,获取视频描述结果;视频描述生成模型训练步骤包括:通过综合评分模块对视频标注质量进行综合评估,根据综合评估分数鼓励视频描述生成模型向高质量标注学习,并抑制低质量标注引入的噪声干扰;通过自审查模块基于强化学习算法计算每一条视频描述的偏差奖励,并根据偏差奖励估计每一条预测描述的预期奖励收益,通过预期奖励收益指引视频描述生成模型进行优化。与现有技术相比,本发明提升了视频描述的准确性和语义丰富度。
技术关键词
视频编码 偏差 强化学习算法 语句 模块 上存储计算机程序 视频特征提取 视觉 可读存储介质 噪声 网络 解码 矩阵 指标 序列 语义