视频分割方法、服务器、存储介质及程序产品

申请号：CN202410969075

申请日期：2024-07-18

公开号：CN119031206A

公开日期：2024-11-26

类型：发明专利

摘要

本申请提供一种视频分割方法、服务器、存储介质及程序产品，本申请的方法，通过将待分割的视频数据切分成多个数据片段，通过视频主题分割模型分别提取各数据片段的单一模态的特征，包括文本模态的文本特征和视觉模态的视觉特征，将各数据片段的文本特征和视觉特征融合，可以在中间表示级别进行多模态信息的融合，可以更好地捕捉不同模态之间的关系和交互，获得各数据片段的更高质量的多模态融合特征；进一步地，根据各所述数据片段的多模态融合特征，预测各所述数据片段是否为主题边界，可以精准地预测视频数据的主题边界，提升了主题边界识别的精准度，从而提升了视频主题分割结果的精准度和质量。

技术关键词

融合视觉特征主题文本融合特征样本视频分割方法数据视频段注意力计算机执行指令阶段会议编码模块服务器多模态信息处理器

系统为您推荐了相关专利信息

一种复杂环境下的牛尾区域检测方法

区域检测方法抑制背景干扰模块网络分辨率

基于RAG与幻觉校正的科研知识检索方法、增强系统、存储介质及服务器设备

知识检索方法科研核查技术校正模块实体关系提取

大语言模型的微调方法、资源推荐方法、装置和设备

对象数据插件大语言模型资源特征

一种基于大语言模型的客服交互方法及系统

大语言模型服务设备实时语音关键字资料

基于双分支交互与语义对齐的河湖遥感监测方法及系统

超分辨率遥感监测方法分支交互网络语义