冷启动驱动及主动学习机制相结合的数字人形象生成方法
申请号:CN202511324476
申请日期:2025-09-17
公开号:CN120833401B
公开日期:2025-12-05
类型:发明专利
摘要
本申请公开了一种冷启动驱动及主动学习机制相结合的数字人形象生成方法,本方案通过源于冷启动过程且具备高度个性化与动态适配性的预设少样本情感语音生成模型对输入数据进行处理,可以在大规模未标注输入数据上实现高效的个性化、多情感语音批量生成,从而输出高保真、情感与个性表达一致的目标音频文件;并且预设少样本情感语音生成模型是基于对候选训练样本利用第一冷启动质量评估器筛选后的第一合格样本训练得到的,使得能够在极少数据条件下启动,实现了在小样本条件下的高质量个性化数字人形象自动生成;另外,通过输入目标情感嵌入向量及目标性格特征向量,实现语音驱动下的表情同步生成,增强数字人自然交互能力与风格一致性。
技术关键词
语音生成模型
形象生成方法
图像生成器
指标
条件生成对抗网络
训练样本集
语音可懂度
控制器模块
文本
回放模块
数据
机制
风格
适配器
拉普拉斯
参数
调节器