一种基于融合粗细颗粒度的民航人声识别方法、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于融合粗细颗粒度的民航人声识别方法、设备及介质
申请号:CN202510762452
申请日期:2025-06-09
公开号:CN120452453A
公开日期:2025-08-08
类型:发明专利
摘要
本发明提供了一种基于融合粗细颗粒度的民航人声识别方法、设备及介质,涉及民航人声识别技术领域,方法包括:获取预设时长的待识别语音片段;对待识别语音片段执行预设的粗颗粒度的人声片段识别,以得到粗颗粒度人声片段列表QA;获取QA中每一粗颗粒度人声片段对应的文字列表集QB;对待识别语音片段执行预设的细颗粒度的人声片段识别,以得到细颗粒度人声片段列表QC;遍历QB,若QBu,a对应的时间戳在QC中的任一细颗粒度人声片段对应的时间范围内,则保留QBu,a;否则,删除QBu,a;本发明能够避免因环境噪声干扰产生语义偏移的情况发生,提高航空运行的安全性。
技术关键词
人声识别方法 滑动窗口 字符 语音 列表 人声识别技术 置信度阈值 环境噪声干扰 可读存储介质 处理器 电子设备 程序 指令 航空 语义 计算机
系统为您推荐了相关专利信息
文本 评分方法 分词算法 大语言模型 模型预训练
智能机器人 引导系统 多模态 生成警报信号 静息心率
舆情分析方法 融合特征 事件特征 三元组 图谱
误差修正方法 交通事故现场 无人机 误差修正模型 贝叶斯神经网络
语音 门禁设备 神经网络算法 三维建模数据 传感