基于语音大模型的老挝语-英语混合语言语音合成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于语音大模型的老挝语-英语混合语言语音合成方法
申请号:CN202510786476
申请日期:2025-06-12
公开号:CN120708594A
公开日期:2025-09-26
类型:发明专利
摘要
本发明涉及基于语音大模型的老挝语‑英语混合语言语音合成方法,属于自然语言处理技术领域。老挝由于其独特的经济背景、地理位置以及历史因素,使其语言面临着文本中存在许多英语词汇,针对在单语语音数据的情况下,老挝语中的英语词汇难以准确发音的问题,本发明提出了一种基于语音大模型的老挝语‑英语混合语言语音合成方法,主要包括融合不同语言的统一潜在空间的混合语言语音大模型构建、融入老挝语语言ID、老挝语‑英语混合语言语音合成三部分。本发明使合成的混合语言语音不仅能在语音质量上达到较高的自然度,还能够有效应对不同语言的发音差异,使得在语言切换时的合成语音听起来更加流畅。
技术关键词
英语 注意力机制 神经机器翻译系统 非暂态计算机可读存储介质 声学特征 语音编码器 文本 音频 处理器 计算机程序产品 语音特征 发音 自然语言 标记 多用户 存储器 矩阵