基于标注质量和奖励偏差的视频描述方法、系统及介质

申请号：CN202511169416

申请日期：2025-08-20

公开号：CN120980320A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及一种基于标注质量和奖励偏差的视频描述方法、系统及介质，方法包括以下步骤：提取目标视频的视频特征；使用层次式视觉网络对视频特征进行编码，得到多级视频编码特征；通过视频描述生成模型将多级视频编码特征解码，获取视频描述结果；视频描述生成模型训练步骤包括：通过综合评分模块对视频标注质量进行综合评估，根据综合评估分数鼓励视频描述生成模型向高质量标注学习，并抑制低质量标注引入的噪声干扰；通过自审查模块基于强化学习算法计算每一条视频描述的偏差奖励，并根据偏差奖励估计每一条预测描述的预期奖励收益，通过预期奖励收益指引视频描述生成模型进行优化。与现有技术相比，本发明提升了视频描述的准确性和语义丰富度。

技术关键词

视频编码偏差强化学习算法语句模块上存储计算机程序视频特征提取视觉可读存储介质噪声网络解码矩阵指标序列语义