多语义视频处理方法、装置、设备、介质和程序产品

申请号：CN202410825159

申请日期：2024-06-25

公开号：CN118379670B

公开日期：2024-12-10

类型：发明专利

摘要

本发明实施例提供一种多语义视频处理方法、装置、设备、介质和程序产品，该方法包括：先从空间角度进行特征提取，以得到待处理视频中视频帧各自的空间特征，再从时间角度进行特征提取，以得到视频帧各自的时空特征。进而，根据各视频帧的时空特征得到整个待处理视频的时空特征。最终，可以根据整个待处理视频的时空特征来对视频的语义进行分析，以定位出视频中的语义边界点，即语义发生变化的目标视频帧。其中，时空特征在反映视频帧中对象的空间信息、颜色信息以及对象的姿态变化信息等。因此，整个视频的时空特征可以更加完整、准确地反映对象在视频中的姿态变化，从而可以更细粒度的进行视频的语义分析，提高视频中语义边界点的定位准确性。

技术关键词

视频帧空间特征提取语义分析模型采样率非暂时性机器可读存储介质特征提取网络交叉注意力机制校准特征校验解码网络嵌入位置信息解码器序列处理器编辑对象计算机程序产品蒸馏

系统为您推荐了相关专利信息

一种基于频域目标散射特性的基带回波快速生成方法

快速生成方法雷达回波生成方法射频信号

一种小样本动作识别方法、装置、设备及介质

动作识别方法样本原型动作识别模型视频编码器

一种监控视频中模糊车牌的跟踪检测识别方法及装置

检测识别方法模糊车牌 KCF算法融合特征卡尔曼滤波器

一种基于多模态视频分类模型的交通事故检测方法及系统

交通事故检测方法视频分类模型多模态交通事故检测系统交通监控视频

一种通过增量信息感知增强视频描述生成的方法及系统

信息编码器解码器融合语义视频帧生成结构