一种用于人机交互的语音合成方法及系统

申请号：CN202511369977

申请日期：2025-09-24

公开号：CN120877706A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了一种用于人机交互的语音合成方法及系统，具体涉及语音合成技术领域，用于解决现有语音合成系统在高可靠性场景下对高风险内容缺乏自适应调整能力的问题；是通过多级分析处理机制实现：首先计算声学特征预测值的差分序列并分析异常峰值来确定语音单元的不确定性指标，结合局部信息熵序列变化率检测熵值突变点；然后将不确定性指标与熵值突变点融合识别高不确定性文本片段，通过语义焦点单元识别和语境依存度分析评估语义风险等级；最后根据风险等级自适应调整韵律参数并生成合成语音，从而在保持语音自然度的同时显著提升高风险内容的传达准确性和可靠性。

技术关键词

文本声学特征信息熵语音语义向量神经网络声学模型序列语句指标焦点概率分布统计参数滑动窗口语义角色分析模块高风险声码器识别模块