摘要
本发明公开了一种语音交互毛绒玩具的智能唤醒方法、设备及介质,涉及语音交互技术领域,包括,基于原始语音信号构建二维统计图,利用峰值检测和欧式距离分类生成候选声源掩膜集合,对候选声源掩膜集合按照密度得分、谐波性得分和韵律特征得分进行综合排名,获取主声源掩膜,基于幅度衰减比与时延对主声源掩膜进行细化加权,生成主声源软掩膜,并获取纯净语音信号,对纯净语音信号提取梅尔倒谱系数特征,结合隐马尔可夫模型进行音素解码,检测唤醒词及语义触发词,进而判定毛绒玩具的唤醒状态。本发明通过基于音素级隐马尔可夫模型的轻量化建模,实现对唤醒词及语义触发词的精准解码,避免了大规模神经网络的高算力依赖。