一种针对多语种、复杂场景下的语言数据预处理方法

申请号：CN202511447963

申请日期：2025-10-11

公开号：CN120913580A

公开日期：2025-11-07

类型：发明专利

摘要

本发明涉及语言数据处理技术领域，且公开了一种针对多语种、复杂场景下的语言数据预处理方法，基于AutoPrep框架的多语种、复杂场景下的语音数据预处理系统，集成语音增强、语音分割、说话人聚类、目标语音提取与质量过滤五大模块，实现语音数据的自动化、结构化处理，本方案，实现了对多语种语音信号中稳态与瞬态噪声的差异化抑制，特别是在小语种（如哈萨克语、他加禄语）场景中，有效提升了语音信噪比和语音特征的语言无关性，克服了现有技术中小语种缺乏专属音系处理模块而导致音素映射错误率高的问题，增强了低资源语言数据的可用性与处理效果。

技术关键词

数据预处理方法音频分块语言数据处理技术特征提取能力场景频谱特征抑制突发噪声数据预处理系统抑制环境噪声语音活动检测多语种语音异常检测技术过滤模块瞬态噪声深度学习算法残留噪声