基于双通道降噪和动态语义地图的模糊指令解析方法及系统
申请号:CN202411927885
申请日期:2024-12-25
公开号:CN120048269A
公开日期:2025-05-27
类型:发明专利
摘要
本发明涉及智能语音解析领域,涉及基于双通道降噪和动态语义地图的模糊指令解析方法及系统。所述方法包括以下步骤:(1)降噪语音识别:结合双通道语音降噪和语音识别,在高噪声环境下提取目标语音信号并完成语音转文本,输出目标语音信号对应的文本数据;(2)多模态融合:基于实时环境感知,动态调整语音数据、视觉数据及传感器数据的权重;(3)模糊指令解析:接收步骤(1)输出的文本数据,结合步骤(2)输出的优化后语音数据、视觉数据及传感器数据的权重,实现语义地图更新;利用动态更新的语义地图结合设备布局、环境数据和用户指令历史,定位目标设备,并解析模糊指令。本发明提供的方法可提升语音识别精度和模糊指令解析能力,显著提升操作灵活性。
技术关键词
指令解析方法
语义地图
环境传感器数据
地图更新
声纹特征
视觉
文本
信号
语音识别模块
动态更新
降噪模型
多模态
语音识别精度
节点
权重分配策略