摘要
本发明涉及语音识别技术领域,具体涉及基于深度学习的多语种实时语音识别系统及方法。该方法包括:将待识别语音信号输入到维纳滤波模型中,输出增强后的语音信号;利用一组在频率上均匀分布的三角带通滤波器对离散能量谱进行处理,从而获得相应的输出,对所有滤波器的输出做对数运算,求得对数功率谱,并基于对数功率谱离散余弦变换得到语音信号的特征参数,基于特征参数提取语音信号特征矢量;将语音信号特征矢量输入到矢量量化器中,输出量化形成的码矢标号,并将码矢标号输入到HMM语音识别模型中,输出识别结果。本发明能够提高语音识别的准确性,提高实时语音识别服务的稳定性。