摘要
本申请提供了一种基于语音识别的智能通话速记方法、系统和介质。该方法包括:通过获取实时通话的语音信号进行预处理获得优化语音信号并进行语音分帧获得语音帧,再进行语音特征提取,获得实时声纹特征向量和实时语音特征向量并进行处理,获得通话人员身份标签数据及对应的优化语音识别数据,获取语音识别评测数据并进行处理,获得语音识别效准评测指数,最后与预设语音识别效准度阈值进行阈值对比,根据阈值对比结果确定语音识别状态;本申请通过优化语音信号、优化语音识别数据和语音识别效准评测指数的计算与阈值对比,实现了实时通话语音识别和速记的智能性与准确性。