视频生成与筛选方法、装置、设备及介质

申请号：CN202511212490

申请日期：2025-08-27

公开号：CN121000948A

公开日期：2025-11-21

类型：发明专利

摘要

本发明涉及视频处理技术领域，公开了一种视频生成与筛选方法、装置、设备及介质，包括：获取文本描述信息与参考图像信息，通过大模型对文本描述信息进行语义解析，得到多模态语义表示；根据多模态语义表示生成提示词集合，对提示词集合与参考图像信息进行建模得到图像序列信息；利用大模型对图像序列信息进行模型匹配，生成优化提示词，通过视频生成模型基于优化提示词生成视频素材；确定视频素材中相邻帧之间的运动平滑度和画面一致性，并将运动平滑度高于第一预设阈值和画面一致性高于第二预设阈值的视频素材确定为目标视频。本申请可应用于金融科技与医疗养老业务程序系统中，能够在保证视频生成效率的同时提升视频的平滑度与一致性。

技术关键词

视频生成模型多模态生成提示词语义筛选方法图像文本情感特征运动矢量场平滑度主题画面业务程序系统序列医疗养老关键帧可读存储介质场景类别