基于语谱特征和深度学习的部分伪造语音检测方法及系统

申请号：CN202510754409

申请日期：2025-06-06

公开号：CN120452450A

公开日期：2025-08-08

类型：发明专利

摘要

本申请公开了一种基于语谱特征和深度学习的部分伪造语音检测方法及系统，涉及语音真伪检测技术领域，解决了现有的伪造语音检测方法无法有效检测携带短小伪造片段的伪造语音，从而检测准确率性较低的问题，该方法包括提取语音的梅尔语谱图，并将梅尔语谱图按时间方向划分成多个语谱子图；将所述多个语谱子图输入到预先训练的由线性投影层、Transformer编码器网络和xLSTM判别器网络构成的深度学习伪造语音检测模型中，得到代表对应各语谱子图的真实分数；融合各语谱子图的真实分数获得话语级别真实分数，从而得到检测结果，能学习语音谱图的深层表征，并有效捕获真假语音分段之间的差异，从而实现部分伪造语音的高准确率检测。

技术关键词

语音检测方法语音标签语音检测系统子模块模型训练模块音频样本分段序列梯度下降算法前馈神经网络图谱编码器可读存储介质特征提取模块语音特征参数