基于机器视觉的语音输入等待控制方法、系统及存储介质
申请号:CN202411136371
申请日期:2024-08-19
公开号:CN119091881B
公开日期:2025-10-21
类型:发明专利
摘要
本发明公开了基于机器视觉的语音输入等待控制方法、系统及介质,包括:响应于语音识别激活指令,获取目标乘员舱的第一图像信息,并获取目标乘员的第一语音信息;根据第一语音信息判断语音输入是否完整;当确定语音输入不完整,根据第一图像信息确定目标乘员的面部表情时序数据和人体姿态时序数据,进而根据面部表情时序数据和人体姿态时序数据判断目标乘员是否说话中断;当确定目标乘员说话中断,在预设的语音输入等待时长内获取目标乘员的第二语音信息,进而根据第一语音信息和第二语音信息合成得到目标语音输入信息。本发明提高了语音输入的便利性和用户的驾乘体验,可广泛应用于车辆控制技术领域。
技术关键词
乘员
语音输入信息
时序
面部
数据
车载语音识别
语音采集装置
视觉
样本
图像采集装置
人体关键点检测
车辆控制技术
处理器
指令
文本
程序
标签