一种使用合成数据集加速视频扩散模型的方法

申请号：CN202510355770

申请日期：2025-03-25

公开号：CN120297362A

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开了一种使用合成数据集加速视频扩散模型的方法。该方法包括：利用预训练的视频扩散模型生成合成数据集，该合成数据集包含合成视频、潜在空间中的去噪轨迹以及对应的文本提示；利用所述预训练的视频扩散模型作为教师模型，并构建对应的学生模型，所述学生模型和所述教师模型共享相同的结构；基于所述合成数据集，对所述学生模型进行知识蒸馏训练，在知识蒸馏训练过程中，所述学生模型学习所述教师模型的去噪过程并对齐所述教师模型生成的数据分布，直到满足设定的损失函数标准；将经知识蒸馏训练的学生模型作为视频生成模型，应用于视频分析任务。利用本发明，能够生成更高质量和更高分辨率的视频。

技术关键词

学生教师视频生成模型蒸馏视频分析数据分布轨迹文本生成对抗网络特征提取器噪声处理器参数编码计算机设备可读存储介质多模态存储器

系统为您推荐了相关专利信息

一种基于语义解耦的语音信源信道联合编码方法

信源信道联合编码方法矢量量化语义联合损失函数生成式对抗网络

一种基于多模态学习的档案信息提取管理方法及系统

图谱管理方法多模态数据采集动态权重分配文本

一种基于蜂群自组网的分布式边缘智能诊断方法

分布式边缘智能诊断模型智能诊断方法学生云平台数据管理

一种基于知识文本的认知诊断模型及其认知诊断方法

认知诊断方法知识点特征提取模块交互特征非线性

一种1+2+1蒸馏模式的知识蒸馏猕猴桃视觉计数方法

计数方法蒸馏注意力教师学生