一种融合多源特征与跨尺度建模的音频深度伪造检测方法

申请号：CN202511294644

申请日期：2025-09-11

公开号：CN120783799B

公开日期：2025-11-25

类型：发明专利

摘要

本发明涉及音频检测领域，提出一种融合多源特征与跨尺度建模的音频深度伪造检测方法及系统，通过双分支数据增强策略，有效提高了对合成样本中隐蔽伪造模式的识别能力，在保持语音自然性与听觉可接受性的同时，引入具有代表性的伪造扰动空间，从而显著提高了在多类型深度伪造攻击下的泛化与鲁棒性，再分别获取多层次深度音频特征和物理声学特征并进行特征融合，提高了对物理层伪影的敏感度，进一步提高了检测准确性，还通过多尺度注意力增强，高效捕捉伪造音频中跨时间与频率尺度的微弱变化特征，通过分组卷积与多分支注意力路径的结构设计，有效整合了局部与全局感知信息，本发明提高了音频深度伪造检测的准确性、鲁棒性和泛化能力。

技术关键词

深度音频特征融合多源特征声学特征多尺度多层次融合特征伪影分支通道注意力机制数据子带能量特征支路语音音频特征提取深度特征提取策略融合算法全局平均池化