一种音频处理方法和装置

申请号：CN202511254826

申请日期：2025-09-04

公开号：CN120748375A

公开日期：2025-10-03

类型：发明专利

摘要

本发明实施例公开了一种音频处理方法和装置，所述方法包括遍历基于静音检测结果对音频流进行截取确定的断句列表确定当前断句和当前断句的端点检测结果，在当前断句存在语句起点时将当前断句的起始帧确定为最新待识别语句的起始帧，在当前断句存在语句终点时将当前断句的结束帧确定为最新待识别语句的结束帧，根据最新待识别语句的起始帧和结束帧确定最新待识别语句，并对最新待识别语句进行语音识别确定对应的语音识别结果，能够不断更新音频流中的断句和根据断句的端点检测结果确定待识别语句，实现持续的长语音识别，且通过对待识别语句的起始帧到结束帧的完整内容进行识别，能够提高长语音识别的准确性。

技术关键词

语句音频特征语音计算机程序指令计算机程序产品列表端点可读存储介质交互内容序列频谱特征处理器终点场景存储器电子设备语义