基于语谱特征和深度学习的部分伪造语音检测方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于语谱特征和深度学习的部分伪造语音检测方法及系统
申请号:CN202510754409
申请日期:2025-06-06
公开号:CN120452450A
公开日期:2025-08-08
类型:发明专利
摘要
本申请公开了一种基于语谱特征和深度学习的部分伪造语音检测方法及系统,涉及语音真伪检测技术领域,解决了现有的伪造语音检测方法无法有效检测携带短小伪造片段的伪造语音,从而检测准确率性较低的问题,该方法包括提取语音的梅尔语谱图,并将梅尔语谱图按时间方向划分成多个语谱子图;将所述多个语谱子图输入到预先训练的由线性投影层、Transformer编码器网络和xLSTM判别器网络构成的深度学习伪造语音检测模型中,得到代表对应各语谱子图的真实分数;融合各语谱子图的真实分数获得话语级别真实分数,从而得到检测结果,能学习语音谱图的深层表征,并有效捕获真假语音分段之间的差异,从而实现部分伪造语音的高准确率检测。
技术关键词
语音检测方法 语音标签 语音检测系统 子模块 模型训练模块 音频 样本 分段 序列 梯度下降算法 前馈神经网络 图谱 编码器 可读存储介质 特征提取模块 语音特征 参数