基于大模型的视频生成方法、装置、智能体、设备、介质、产品

申请号：CN202511317862

申请日期：2025-09-15

公开号：CN121000950A

公开日期：2025-11-21

类型：发明专利

摘要

本公开提供了一种基于大模型的视频生成方法、装置、智能体、设备、介质、产品，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于数字人、基于人工智能的内容生成等场景。该基于大模型的视频生成方法包括：通过将参考内容与第一视频片段进行时序对齐，确定至少两个参考视频帧，其中，第一视频片段是根据参考内容从参考视频中提取的，参考内容指示了与参考视频中的目标对象相关的参考变化过程；将第一视频片段和第二视频片段进行拼接，得到目标视频，其中，第二视频片段是利用视频生成大模型处理参考内容和至少两个参考视频帧得到的，目标视频中目标对象的至少一个区域的变化过程与参考变化过程相匹配。

技术关键词

视频帧视频生成方法对象文本时序视频生成装置场景输入模块语义人工智能技术对齐模块声纹特征计算机程序产品处理器计算机视觉关系音频指令