实时语音的变音方法、终端设备和存储介质

申请号：CN202510645848

申请日期：2025-05-20

公开号：CN120183419B

公开日期：2025-08-01

类型：发明专利

摘要

本发明适用于音频处理领域，公开了一种实时语音的变音方法、终端设备和存储介质。实时语音的变音方法包括：根据实时对话音频，生成原始语音数据，并根据原始语音数据，确定条件特征、多样性特征、填充数据掩码；根据条件特征、多样性特征、填充数据掩码，确定第一张量信息，并根据原始语音数据，确定说话人嵌入向量；根据第一张量信息、说话人嵌入向量、填充数据掩码，确定第二张量信息；根据第二张量信息、说话人嵌入向量和原始语音数据的音高频率，生成目标音色音频。本发明显著提升了变声过程对原始音色特征的重构精度，使生成语音在音色相似度、语调自然度等感知维度达到类真人水平，提高了实时语音的变音真实性。

技术关键词

实时语音音频数据流式解码器一维卷积神经网络频谱特征语音特征终端设备融合特征音色特征可读存储介质相位对齐波形生成语音处理器频率算法上采样存储器

系统为您推荐了相关专利信息

一种基于大数据的纤维原材料溯源方法及系统

纤维溯源信息溯源方法大数据图像特征向量

一种客户数据后台管理系统及其使用方法

客户后台管理系统在线问卷调查数据采集模块事件驱动机制

基于智能柔性传感系统的人体足踝信息获取方法及设备

柔性传感系统预测网络模型石墨烯织物信息获取方法锂离子电池寿命预测方法

一种基于大数据分析的充电器寿命预测系统

寿命预测系统寿命预测模型充电器监测单元基准

数据处理方法、装置、电子设备、存储介质及芯片

消息状态机数据处理方法标签定时器