摘要
本发明公开了一种用于人机交互的语音合成方法及系统,具体涉及语音合成技术领域,用于解决现有语音合成系统在高可靠性场景下对高风险内容缺乏自适应调整能力的问题;是通过多级分析处理机制实现:首先计算声学特征预测值的差分序列并分析异常峰值来确定语音单元的不确定性指标,结合局部信息熵序列变化率检测熵值突变点;然后将不确定性指标与熵值突变点融合识别高不确定性文本片段,通过语义焦点单元识别和语境依存度分析评估语义风险等级;最后根据风险等级自适应调整韵律参数并生成合成语音,从而在保持语音自然度的同时显著提升高风险内容的传达准确性和可靠性。