摘要
本发明涉及视频处理技术领域,公开了一种视频生成与筛选方法、装置、设备及介质,包括:获取文本描述信息与参考图像信息,通过大模型对文本描述信息进行语义解析,得到多模态语义表示;根据多模态语义表示生成提示词集合,对提示词集合与参考图像信息进行建模得到图像序列信息;利用大模型对图像序列信息进行模型匹配,生成优化提示词,通过视频生成模型基于优化提示词生成视频素材;确定视频素材中相邻帧之间的运动平滑度和画面一致性,并将运动平滑度高于第一预设阈值和画面一致性高于第二预设阈值的视频素材确定为目标视频。本申请可应用于金融科技与医疗养老业务程序系统中,能够在保证视频生成效率的同时提升视频的平滑度与一致性。