一种语音交互毛绒玩具的智能唤醒方法、设备及介质

申请号：CN202511327034

申请日期：2025-09-17

公开号：CN120833780B

公开日期：2025-12-02

类型：发明专利

摘要

本发明公开了一种语音交互毛绒玩具的智能唤醒方法、设备及介质，涉及语音交互技术领域，包括，基于原始语音信号构建二维统计图，利用峰值检测和欧式距离分类生成候选声源掩膜集合，对候选声源掩膜集合按照密度得分、谐波性得分和韵律特征得分进行综合排名，获取主声源掩膜，基于幅度衰减比与时延对主声源掩膜进行细化加权，生成主声源软掩膜，并获取纯净语音信号，对纯净语音信号提取梅尔倒谱系数特征，结合隐马尔可夫模型进行音素解码，检测唤醒词及语义触发词，进而判定毛绒玩具的唤醒状态。本发明通过基于音素级隐马尔可夫模型的轻量化建模，实现对唤醒词及语义触发词的精准解码，避免了大规模神经网络的高算力依赖。

技术关键词

智能唤醒方法毛绒玩具韵律特征掩膜隐马尔可夫模型重构语音信号短时傅里叶变换语义包络序列双麦克风阵列谐波语音信号提取语音交互技术梅尔倒谱系数滤波器时延