一种通过增量信息感知增强视频描述生成的方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种通过增量信息感知增强视频描述生成的方法及系统
申请号:CN202510730429
申请日期:2025-06-03
公开号:CN120640092A
公开日期:2025-09-12
类型:发明专利
摘要
本发明提出了一种通过增量信息感知增强视频描述生成的方法及系统。该方法通过构建包含语义增量信息感知模型和结构增量信息感知模型的视频描述生成模型,分别捕捉视频中的详细语义信息和关键结构内容,量化所有描述的语义和结构信息,并在训练过程中利用低信息量描述监督基本编码器以捕获基础视频信息,利用高信息量描述共同监督基本编码器和增量信息编码器,从而引导模型感知和利用从基础信息到更丰富信息的增量信息。在推理阶段,通过融合语义增量信息感知模型和结构增量信息感知模型来补偿语义增量信息感知模型在理解视频主要信息方面的局限性,提高了视频描述生成的准确率和语义丰富度。
技术关键词
信息编码器 解码器 融合语义 视频帧 生成结构 输入结构 模块 全局特征提取 基础 序列 阶段 参数 周期 数据 文本
系统为您推荐了相关专利信息
梯级水库 发电调度方法 逼近算法 规划 编码器
图像缺陷检测方法 视觉特征 文本特征向量 交叉注意力机制 鲁棒视觉
音频 视频识别 时间段 预警系统 校园
开关运行状态 多时间尺度模型 监测方法 编码器 软阈值函数
语音识别方法 注意力 语音识别网络 解码器 声学特征