摘要
本发明公开了结合图像识别的数字人姿态调整方法及装置,涉及数字人控制技术领域,该方法包括:启动对交互对象的数据采集行为;在进行面部图像数据采集的过程中同步进行累积情绪识别,获得实时交互情绪;进行交互需求解析,获得交互诉求摘要;根据交互诉求摘要生成适配回应文本;融合分析适配回应文本和实时交互情绪,输出情绪姿态序列和韵律标注序列;根据韵律标注序列和适配回应文本进行适配回应语音的同步动态合成播放。本发明解决了现有技术中数字人难以准确感知访客情绪和诉求并进行适配性姿态和语音调整的技术问题,达到了提高数字人对访客情绪和诉求的识别准确性,增强数字人姿态和语音对访客情绪适配性的技术效果。