一种无监督学习的语音质量评价方法、装置、设备及介质
申请号:CN202510764119
申请日期:2025-06-09
公开号:CN120544612A
公开日期:2025-08-26
类型:发明专利
摘要
本发明涉及智能语音技术领域,可应用于金融和医疗领域,公开了一种无监督学习的语音质量评价方法、装置、设备及介质,包括:通过提取语音信号中多维度的语音特征;基于无监督学习的自编码器结构构建语音特征模型,学习语音特征的质量表示并根据学习结果综合评价多维度的语音特征的质量,生成语音特征的质量分数;对比所述清晰语音数据、所述失真语音数据以及所述未标注语音数据,并根据对比结果优化所述语音特征模型;训练优化后的语音特征模型,获取未标注语音数据与优化后的语音特征模型中的语音特征之间的差异,并将差异作为微调需求进行微调训练后的语音特征模型,并输出新的语音特征的质量分数。
技术关键词
语音特征
无监督学习
评价方法
编码器结构
生成语音
数据
重建误差
卷积神经网络提取
智能语音技术
分布特征
短时傅里叶变换
时间域
可读存储介质
信号
评价装置
处理器
频率
注意力机制