摘要
本发明公开了一种基于音素识别的语音后门攻击方法。方法包括:对所有待训练的语音样本进行音素识别,提取每个语音样本的对应音素表;对于语音样本中需要加强的音素进行自适应振幅加强;计算语音数据集的频率强度,并选出频率强度最低的频率初始化纯音触发器,将触发器植入语音样本中并修改标签为目标标签;将投毒的语音样本按照比例混入良性数据集中得到投毒数据集,使用投毒数据集训练的受害者模型将带有植入的后门。本发明在保证触发器隐蔽性的基础上提高了对于语音识别模型后门攻击的有效性,并且对良性样本识别的准确性有较小的影响。