一种音频处理方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种音频处理方法和装置
申请号:CN202511254826
申请日期:2025-09-04
公开号:CN120748375A
公开日期:2025-10-03
类型:发明专利
摘要
本发明实施例公开了一种音频处理方法和装置,所述方法包括遍历基于静音检测结果对音频流进行截取确定的断句列表确定当前断句和当前断句的端点检测结果,在当前断句存在语句起点时将当前断句的起始帧确定为最新待识别语句的起始帧,在当前断句存在语句终点时将当前断句的结束帧确定为最新待识别语句的结束帧,根据最新待识别语句的起始帧和结束帧确定最新待识别语句,并对最新待识别语句进行语音识别确定对应的语音识别结果,能够不断更新音频流中的断句和根据断句的端点检测结果确定待识别语句,实现持续的长语音识别,且通过对待识别语句的起始帧到结束帧的完整内容进行识别,能够提高长语音识别的准确性。
技术关键词
语句 音频特征 语音 计算机程序指令 计算机程序产品 列表 端点 可读存储介质 交互内容 序列 频谱特征 处理器 终点 场景 存储器 电子设备 语义