基于多模态协同优化的决策方法、装置、设备及介质

申请号：CN202510918105

申请日期：2025-07-03

公开号：CN120822176A

公开日期：2025-10-21

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于机器人智能体决策、金融科技及医疗健康等业务场景中，公开了一种基于多模态协同优化的决策方法、装置、设备及介质，包括：获取视觉、文本、声音和触觉数据，并通过图像编码器、文本编码器、听觉编码器和触觉编码器生成相应特征。通过正负样本图像对和文本对优化视觉和文本编码特征，基于跨模态相似度分配融合权重，并应用权重加权处理各模态特征，生成协同决策特征，最终通过动作解码器生成动作决策组。本发明通过融合多模态感知信息优化决策特征生成方式，提升执行精度和可靠性。跨模态相似度优化与合理权重分配，提升了复杂环境下任务执行的精确性与高效性。

技术关键词

多模态协同跨模态编码特征视觉特征决策方法文本编码器图像编码器样本生成动作触觉特征文本特征向量听觉解码器数据标识符

系统为您推荐了相关专利信息

一种基于去偏变分推断提示调优的图像识别方法

训练图像数据令牌视觉特征图像编码器图像识别方法

阿尔茨海默病中进展期轻度认知障碍预测方法

轻度认知障碍注意力阿尔茨海默表格特征混合块

基于LLM推理和集成的图像检索方法及装置

字幕图像检索方法视觉特征检索图像编辑

一种基于联合retinex机制的内窥镜图像增强方法

内窥镜图像增强模型注意力池化特征全卷积神经网络

科技成果全生命周期溯源追踪管理系统

溯源追踪管理系统智能分析决策生成决策建议跨模态数据协议