一种跨语种语音识别方法、系统、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种跨语种语音识别方法、系统、设备及存储介质
申请号:CN202511031151
申请日期:2025-07-25
公开号:CN120808756A
公开日期:2025-10-17
类型:发明专利
摘要
本申请公开了一种跨语种语音识别方法、系统、设备及存储介质,本方法通过将训练语音进行预处理,得到训练语音帧序列;从训练语音帧序列中提取内容表征、说话人表征以及音高表征;根据内容表征、说话人表征以及音高表征进行语音重构,得到目标语种语音;基于训练语音,根据目标语种语音构建得到目标语种语音识别模型;响应目标语种识别指令,获取目标语音;将目标语音输入至目标语种语音识别模型,得到目标语种语音识别模型输出的识别结果,能够通过跨语种特征解耦与自监督迁移机制,在极低标注数据条件下实现方言声学特性精准建模,显著提升桂柳话复杂声调与特色词汇的识别鲁棒性,实现方言场景下的高效泛化应用。
技术关键词
语音识别模型 语音识别方法 语种识别 序列 重构 计算机可执行指令 密集特征 韵律特征 调控策略 解码器 声学特征 频谱特征 损失函数优化 语音识别系统 编码器参数 深度学习网络 阶段 可读存储介质
系统为您推荐了相关专利信息
双向特征金字塔 学生 大数据 课堂注意力 数据标签
锂电池健康状态 隐马尔科夫模型 隐马尔可夫模型 参数 电子设备
共享控制方法 人机协作 多模态信息 机械臂 卡尔曼滤波器
家禽 监测管理系统 监测管理方法 智能视觉监控 大数据
肢体康复训练装置 生理反馈信息 反馈控制模块 力学传感器 序列