一种无监督学习的语音质量评价方法、装置、设备及介质

申请号：CN202510764119

申请日期：2025-06-09

公开号：CN120544612A

公开日期：2025-08-26

类型：发明专利

摘要

本发明涉及智能语音技术领域，可应用于金融和医疗领域，公开了一种无监督学习的语音质量评价方法、装置、设备及介质，包括：通过提取语音信号中多维度的语音特征；基于无监督学习的自编码器结构构建语音特征模型，学习语音特征的质量表示并根据学习结果综合评价多维度的语音特征的质量，生成语音特征的质量分数；对比所述清晰语音数据、所述失真语音数据以及所述未标注语音数据，并根据对比结果优化所述语音特征模型；训练优化后的语音特征模型，获取未标注语音数据与优化后的语音特征模型中的语音特征之间的差异，并将差异作为微调需求进行微调训练后的语音特征模型，并输出新的语音特征的质量分数。

技术关键词

语音特征无监督学习评价方法编码器结构生成语音数据重建误差卷积神经网络提取智能语音技术分布特征短时傅里叶变换时间域可读存储介质信号评价装置处理器频率注意力机制

系统为您推荐了相关专利信息

基于磁性隧道结阵列的关键词语音识别方法及装置

磁性隧道结阵列语音关键词识别 MFCC特征 MRAM阵列磁隧道结

一种基于知识与数据双轮驱动的多信号融合感应电机故障诊断方法

感应电机电机运行数据故障诊断模型仿真数据双轮

一种语音转换方法、装置、电子设备及存储介质

语音转换方法音频样本神经网络模型声码器

基于分阶段配准的图像融合方法、装置及电子设备

血管分割图像融合方法影像分阶段控制点

一种基于多维动态贝叶斯网络的重要物资物流风险评价方法

动态贝叶斯网络风险评价方法节点概率分布函数物流