一种多模态大模型的推理加速方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多模态大模型的推理加速方法
申请号:CN202510339921
申请日期:2025-03-21
公开号:CN120278264A
公开日期:2025-07-08
类型:发明专利
摘要
本发明公开了一种多模态大模型的推理加速方法,属于人工智能技术领域,该多模态大模型的推理加速方法,包括下述具体步骤:步骤一:对输入的多模态数据进行特征分析与模态复杂度评估;步骤二:根据复杂度动态选择单模态子网络的计算深度与参数量;步骤三:采用分层融合策略,对低维特征实施低秩跨模态注意力计算,对高维特征实施缓存共享;步骤四:基于硬件特性分配模态处理模块,并通过高速总线同步融合结果。本发明通过量化模态复杂度,结合Gumbe l‑Softmax采样减少冗余计算,通过公式计算低秩序注意力,大大降低了计算复杂度,通过缓存共享使内存占用降低,通过异构分配使硬件利用率大大提高。
技术关键词
多模态 复杂度 注意力 融合策略 矩阵 人工智能技术 贪心算法 跨设备 分层 跨模态 动态 网络 训练集 因子 核心 定义 分辨率 异构 冗余
系统为您推荐了相关专利信息
应急救援仿真方法 生理 决策 计算机设备 团队
样本 文本 预测类别 面向航空航天 标签
推理架构 复杂度 答案 逻辑 层级
多模态语音 智能座舱 交互系统 意图 动态上下文信息
图像增强模型 照度 图像块 图像增强模块 图像配准