基于多模态协同优化的决策方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态协同优化的决策方法、装置、设备及介质
申请号:CN202510918105
申请日期:2025-07-03
公开号:CN120822176A
公开日期:2025-10-21
类型:发明专利
摘要
本发明涉及人工智能技术领域,可应用于机器人智能体决策、金融科技及医疗健康等业务场景中,公开了一种基于多模态协同优化的决策方法、装置、设备及介质,包括:获取视觉、文本、声音和触觉数据,并通过图像编码器、文本编码器、听觉编码器和触觉编码器生成相应特征。通过正负样本图像对和文本对优化视觉和文本编码特征,基于跨模态相似度分配融合权重,并应用权重加权处理各模态特征,生成协同决策特征,最终通过动作解码器生成动作决策组。本发明通过融合多模态感知信息优化决策特征生成方式,提升执行精度和可靠性。跨模态相似度优化与合理权重分配,提升了复杂环境下任务执行的精确性与高效性。
技术关键词
多模态协同 跨模态 编码特征 视觉特征 决策方法 文本编码器 图像编码器 样本 生成动作 触觉特征 文本特征向量 听觉 解码器 数据 标识符
系统为您推荐了相关专利信息
训练图像数据 令牌 视觉特征 图像编码器 图像识别方法
轻度认知障碍 注意力 阿尔茨海默 表格特征 混合块
字幕 图像检索方法 视觉特征 检索图像 编辑
内窥镜 图像增强模型 注意力 池化特征 全卷积神经网络
溯源追踪管理系统 智能分析决策 生成决策建议 跨模态数据 协议