一种基于统一模型架构的多模态数据合成方法、装置、设备、介质及产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于统一模型架构的多模态数据合成方法、装置、设备、介质及产品
申请号:CN202511587749
申请日期:2025-11-03
公开号:CN121030696A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于统一模型架构的多模态数据合成方法、装置、设备、介质及产品,涉及信息提取技术领域,该方法先获取包括图像数据、文本数据、音频数据、传感器数据的待合成数据,经预处理得到对应各模态的序列数据;再基于序列数据提取全局语义因子、局部语义因子、细节三级语义因子,全局语义因子通过任务指令筛选候选模板并结合序列数据评分得到,局部语义因子由序列数据聚类后特征池化生成,细节语义因子依据序列数据的重建误差及其变化得到;将各模态序列数据与对应标识合成,并和三级语义因子拼接为合成序列数据;最后把合成序列数据输入同一transformer编码器完成多模态数据合成,实现多模态数据的高效协同与深度整合。
技术关键词
语义 因子 图像序列数据 重建误差 文本 音频 传感器 多模态 模板 标识 计算机程序产品 信息提取技术 指令 编码器 可读存储介质 存储计算机程序
系统为您推荐了相关专利信息
知识点 语音 音频 个性化学习路径 逻辑
数据识别方法 街景 采集设备 坐标 像素点
复杂度 文本 多学科 推理方法 思路
文本 语句 数据处理方法 计算机程序产品 关系
标签设计方法 标签设计技术 强度 效应 频率