一种多信道语音处理方法及系统

申请号：CN202510909250

申请日期：2025-07-01

公开号：CN120600031A

公开日期：2025-09-05

类型：发明专利

摘要

本发明公开了一种多信道语音处理方法及系统，属于人工智能与语音信号处理领域。包括：获取多信道音频信号并构建SSL的单信道预训练模型；基于多信道音频信号，对SSL的单信道预训练模型进行结构优化，得到多信道声纹特征提取预训练模型；进行多阶段联合优化训练，结合AAM损失对多信道声纹特征提取预训练模型进行微调，生成多信道语音处理模型；当接收到待处理的多声道音频信号时，通过多信道语音处理模型处理待处理的多声道音频信号，输出高区分性的多信道声纹特征。本发明旨在提高多信道场景下说话人验证的准确性和鲁棒性，显著降低错误率并提升系统对复杂声学环境的适应能力。

技术关键词

多信道预训练模型多声道音频声纹特征多阶段联合注意力机制信道特征语音信号处理前馈神经网络模型训练模块摘要通道鲁棒性数据获取模块