一种基于多模态特征融合的抑郁检测方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多模态特征融合的抑郁检测方法及装置
申请号:CN202411931889
申请日期:2024-12-26
公开号:CN119889591A
公开日期:2025-04-25
类型:发明专利
摘要
本发明公开了一种基于多模态特征融合的抑郁检测方法及装置,方法包括:S1、获取多模态抑郁症数据集;S2、将音频特征和视频特征变换到相同维的空间以进行对齐;S3、将变换后的音频特征和视频特征进行特征增强,并将对齐后的音频特征和视频特征与特征增强后的特征相加形成残差连接;S4、根据样本长度拼接增强后的音频特征和视频特征,将拼接后的音频特征和视频特征进行特征融合;S5、将融合后的特征乘以掩码进行平均池化,使用线性层作为分类头、带逻辑输出的二元交叉熵损失作为损失函数,得到预测值;S6、采用混淆矩阵热力图进行可视化评估结果。本发明能够在降低成本的同时实现高精度的抑郁检测,并支持检测结果的可视化展示。
技术关键词
音频特征 多模态特征融合 视频 抑郁 热力图 对齐模块 拼接模块 注意力 状态空间模型 样本 数据 逻辑 标签 矩阵 线性 序列 语音