一种基于融合粗细颗粒度的民航人声识别方法、设备及介质
申请号:CN202510762452
申请日期:2025-06-09
公开号:CN120452453A
公开日期:2025-08-08
类型:发明专利
摘要
本发明提供了一种基于融合粗细颗粒度的民航人声识别方法、设备及介质,涉及民航人声识别技术领域,方法包括:获取预设时长的待识别语音片段;对待识别语音片段执行预设的粗颗粒度的人声片段识别,以得到粗颗粒度人声片段列表QA;获取QA中每一粗颗粒度人声片段对应的文字列表集QB;对待识别语音片段执行预设的细颗粒度的人声片段识别,以得到细颗粒度人声片段列表QC;遍历QB,若QBu,a对应的时间戳在QC中的任一细颗粒度人声片段对应的时间范围内,则保留QBu,a;否则,删除QBu,a;本发明能够避免因环境噪声干扰产生语义偏移的情况发生,提高航空运行的安全性。
技术关键词
人声识别方法
滑动窗口
字符
语音
列表
人声识别技术
置信度阈值
环境噪声干扰
可读存储介质
处理器
电子设备
程序
指令
航空
语义
计算机