一种无监督学习的语音质量评价方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种无监督学习的语音质量评价方法、装置、设备及介质
申请号:CN202510764119
申请日期:2025-06-09
公开号:CN120544612A
公开日期:2025-08-26
类型:发明专利
摘要
本发明涉及智能语音技术领域,可应用于金融和医疗领域,公开了一种无监督学习的语音质量评价方法、装置、设备及介质,包括:通过提取语音信号中多维度的语音特征;基于无监督学习的自编码器结构构建语音特征模型,学习语音特征的质量表示并根据学习结果综合评价多维度的语音特征的质量,生成语音特征的质量分数;对比所述清晰语音数据、所述失真语音数据以及所述未标注语音数据,并根据对比结果优化所述语音特征模型;训练优化后的语音特征模型,获取未标注语音数据与优化后的语音特征模型中的语音特征之间的差异,并将差异作为微调需求进行微调训练后的语音特征模型,并输出新的语音特征的质量分数。
技术关键词
语音特征 无监督学习 评价方法 编码器结构 生成语音 数据 重建误差 卷积神经网络提取 智能语音技术 分布特征 短时傅里叶变换 时间域 可读存储介质 信号 评价装置 处理器 频率 注意力机制
系统为您推荐了相关专利信息
磁性隧道结阵列 语音关键词识别 MFCC特征 MRAM阵列 磁隧道结
感应电机 电机运行数据 故障诊断模型 仿真数据 双轮
语音转换方法 音频 样本 神经网络模型 声码器
血管分割 图像融合方法 影像 分阶段 控制点
动态贝叶斯网络 风险评价方法 节点 概率分布函数 物流