一种基于融合粗细颗粒度的民航人声识别方法、设备及介质

申请号：CN202510762452

申请日期：2025-06-09

公开号：CN120452453A

公开日期：2025-08-08

类型：发明专利

摘要

本发明提供了一种基于融合粗细颗粒度的民航人声识别方法、设备及介质，涉及民航人声识别技术领域，方法包括：获取预设时长的待识别语音片段；对待识别语音片段执行预设的粗颗粒度的人声片段识别，以得到粗颗粒度人声片段列表QA；获取QA中每一粗颗粒度人声片段对应的文字列表集QB；对待识别语音片段执行预设的细颗粒度的人声片段识别，以得到细颗粒度人声片段列表QC；遍历QB，若QBu，a对应的时间戳在QC中的任一细颗粒度人声片段对应的时间范围内，则保留QBu，a；否则，删除QBu，a；本发明能够避免因环境噪声干扰产生语义偏移的情况发生，提高航空运行的安全性。

技术关键词

人声识别方法滑动窗口字符语音列表人声识别技术置信度阈值环境噪声干扰可读存储介质处理器电子设备程序指令航空语义计算机

系统为您推荐了相关专利信息

一种基于大语言模型token的文本通用程度评分方法

文本评分方法分词算法大语言模型模型预训练

一种多模态融合的医院内智能机器人就诊引导系统及方法

智能机器人引导系统多模态生成警报信号静息心率

产品舆情分析方法、装置、存储介质及计算机设备

舆情分析方法融合特征事件特征三元组图谱

基于无人机的交通事故现场快速制图误差修正方法

误差修正方法交通事故现场无人机误差修正模型贝叶斯神经网络

基于人工智能的应答方法及系统