冷启动驱动及主动学习机制相结合的数字人形象生成方法

申请号：CN202511324476

申请日期：2025-09-17

公开号：CN120833401B

公开日期：2025-12-05

类型：发明专利

摘要

本申请公开了一种冷启动驱动及主动学习机制相结合的数字人形象生成方法，本方案通过源于冷启动过程且具备高度个性化与动态适配性的预设少样本情感语音生成模型对输入数据进行处理，可以在大规模未标注输入数据上实现高效的个性化、多情感语音批量生成，从而输出高保真、情感与个性表达一致的目标音频文件；并且预设少样本情感语音生成模型是基于对候选训练样本利用第一冷启动质量评估器筛选后的第一合格样本训练得到的，使得能够在极少数据条件下启动，实现了在小样本条件下的高质量个性化数字人形象自动生成；另外，通过输入目标情感嵌入向量及目标性格特征向量，实现语音驱动下的表情同步生成，增强数字人自然交互能力与风格一致性。

技术关键词

语音生成模型形象生成方法图像生成器指标条件生成对抗网络训练样本集语音可懂度控制器模块文本回放模块数据机制风格适配器拉普拉斯参数调节器