结合图像识别的数字人姿态调整方法及装置

申请号：CN202411558827

申请日期：2024-11-04

公开号：CN119473209B

公开日期：2025-05-06

类型：发明专利

摘要

本发明公开了结合图像识别的数字人姿态调整方法及装置，涉及数字人控制技术领域，该方法包括：启动对交互对象的数据采集行为；在进行面部图像数据采集的过程中同步进行累积情绪识别，获得实时交互情绪；进行交互需求解析，获得交互诉求摘要；根据交互诉求摘要生成适配回应文本；融合分析适配回应文本和实时交互情绪，输出情绪姿态序列和韵律标注序列；根据韵律标注序列和适配回应文本进行适配回应语音的同步动态合成播放。本发明解决了现有技术中数字人难以准确感知访客情绪和诉求并进行适配性姿态和语音调整的技术问题，达到了提高数字人对访客情绪和诉求的识别准确性，增强数字人姿态和语音对访客情绪适配性的技术效果。

技术关键词

面部特征识别情绪识别模型面部图像数据情绪特征文本序列摘要对象语音特征选择状态更新样本数据采集模块播放模块节点滑动时间窗口数据更新调节单元