一种音素后验图模型训练方法、设备、介质及程序产品

申请号：CN202510870662

申请日期：2025-06-26

公开号：CN120544585A

公开日期：2025-08-26

类型：发明专利

摘要

本申请公开了一种音素后验图模型训练方法、设备、介质及程序产品，涉及音频处理技术领域。该方法包括：通过利用主唱音频与和声音频在音素后验图特征上的差异，对音素后验图模型进行训练，并且和声音频为基于主唱音频生成的包含除主唱外其余人声的音频，由此经过训练得到的训练后音素后验图模型具备从和声音频中提取主唱音频的能力，利用该训练后音素后验图模型提取待转换歌声文件中的主唱歌声内容，能够提高主唱歌声内容提取的准确性，进而提高歌声转换的质量。

技术关键词

模型训练方法转换方法音频解码器融合特征场景人声音色特征存储计算机程序计算机程序产品处理器可读存储介质电子设备存储器数据