摘要
本发明公开了一种多信道语音处理方法及系统,属于人工智能与语音信号处理领域。包括:获取多信道音频信号并构建SSL的单信道预训练模型;基于多信道音频信号,对SSL的单信道预训练模型进行结构优化,得到多信道声纹特征提取预训练模型;进行多阶段联合优化训练,结合AAM损失对多信道声纹特征提取预训练模型进行微调,生成多信道语音处理模型;当接收到待处理的多声道音频信号时,通过多信道语音处理模型处理待处理的多声道音频信号,输出高区分性的多信道声纹特征。本发明旨在提高多信道场景下说话人验证的准确性和鲁棒性,显著降低错误率并提升系统对复杂声学环境的适应能力。