多语义视频处理方法、装置、设备、介质和程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多语义视频处理方法、装置、设备、介质和程序产品
申请号:CN202410825159
申请日期:2024-06-25
公开号:CN118379670B
公开日期:2024-12-10
类型:发明专利
摘要
本发明实施例提供一种多语义视频处理方法、装置、设备、介质和程序产品,该方法包括:先从空间角度进行特征提取,以得到待处理视频中视频帧各自的空间特征,再从时间角度进行特征提取,以得到视频帧各自的时空特征。进而,根据各视频帧的时空特征得到整个待处理视频的时空特征。最终,可以根据整个待处理视频的时空特征来对视频的语义进行分析,以定位出视频中的语义边界点,即语义发生变化的目标视频帧。其中,时空特征在反映视频帧中对象的空间信息、颜色信息以及对象的姿态变化信息等。因此,整个视频的时空特征可以更加完整、准确地反映对象在视频中的姿态变化,从而可以更细粒度的进行视频的语义分析,提高视频中语义边界点的定位准确性。
技术关键词
视频帧 空间特征提取 语义分析模型 采样率 非暂时性机器可读存储介质 特征提取网络 交叉注意力机制 校准 特征校验 解码网络 嵌入位置信息 解码器 序列 处理器 编辑 对象 计算机程序产品 蒸馏
系统为您推荐了相关专利信息
快速生成方法 雷达 回波生成方法 射频 信号
动作识别方法 样本 原型 动作识别模型 视频编码器
检测识别方法 模糊车牌 KCF算法 融合特征 卡尔曼滤波器
交通事故检测方法 视频分类模型 多模态 交通事故检测系统 交通监控视频
信息编码器 解码器 融合语义 视频帧 生成结构