一种基于混合专家的半监督方言情感语音合成系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于混合专家的半监督方言情感语音合成系统
申请号:CN202510778709
申请日期:2025-06-11
公开号:CN120299449A
公开日期:2025-07-11
类型:发明专利
摘要
本发明涉及方言语音合成,具体涉及一种基于混合专家的半监督方言情感语音合成系统,文本分析模块,对输入的方言文本进行预处理,并通过特征提取和特征融合生成文本表征向量;混合专家模块,获取方言声学特征、韵律特征、情感特征和通用声学特征;动态路由模块,通过任务感知型软路由算法实现专家之间的智能协作;半监督学习模块,利用带标注的方言情感语音数据对监督学习进行训练,同时利用未标注的方言情感语音数据对自监督学习进行训练;声学参数生成模块,对各专家的输出进行整合,生成完整的声学参数集合;神经声码器,将声学参数集合转换为最终的方言情感语音;本发明能够有效克服难以在样本资源匮乏的情况下精准合成方言情感语音的缺陷。
技术关键词
韵律特征 方言词汇 情感特征 文本 语音 声学特征 一维卷积神经网络 韵律模式 半监督学习 情感分类器 语义特征 声码器 通用特征 特征融合网络 注意力 参数 交互特征 智能协作 融合全局 感知损失函数