一种基于情感识别的跨模态音乐自动生成系统及方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于情感识别的跨模态音乐自动生成系统及方法
申请号:CN202510842977
申请日期:2025-06-23
公开号:CN120431891A
公开日期:2025-08-05
类型:发明专利
摘要
本发明属于情感音乐生成技术领域,具体涉及一种基于情感识别的跨模态音乐自动生成系统及方法,其方法步骤为:通过信号采集单元同步采集用户面部表情、语音音调及ECG生理信号;通过多模态情感识别模型对采集到的信息进行处理,以获取VAD三维连续情感向量,将VAD三维连续情感向量输入音乐生成模块,通过音乐生成模块中的情感自编码器与音乐自编码器构建共享跨模态潜在空间;采用对比学习损失函数约束情感‑音乐在潜在空间中的一致性;基于Mus‑Decoder生成MIDI格式的音乐文件。本系统能够充分的结合面部表情、语音音调和ECG生理信号多模态的方式,生成与用户当前情绪相匹配的音乐,达到情感语义一致。
技术关键词
音乐自动生成方法 跨模态 多模态情感识别 音乐自动生成系统 记忆系统 注意力机制 信号采集单元 变换器 前馈神经网络 编码器 音乐生成技术 模块 面部 生理 语音 元素 视觉