一种多模态大模型的推理加速方法

申请号：CN202510339921

申请日期：2025-03-21

公开号：CN120278264A

公开日期：2025-07-08

类型：发明专利

摘要

本发明公开了一种多模态大模型的推理加速方法，属于人工智能技术领域，该多模态大模型的推理加速方法，包括下述具体步骤：步骤一：对输入的多模态数据进行特征分析与模态复杂度评估；步骤二：根据复杂度动态选择单模态子网络的计算深度与参数量；步骤三：采用分层融合策略，对低维特征实施低秩跨模态注意力计算，对高维特征实施缓存共享；步骤四：基于硬件特性分配模态处理模块，并通过高速总线同步融合结果。本发明通过量化模态复杂度，结合Gumbe l‑Softmax采样减少冗余计算，通过公式计算低秩序注意力，大大降低了计算复杂度，通过缓存共享使内存占用降低，通过异构分配使硬件利用率大大提高。

技术关键词

多模态复杂度注意力融合策略矩阵人工智能技术贪心算法跨设备分层跨模态动态网络训练集因子核心定义分辨率异构冗余

系统为您推荐了相关专利信息

一种应急救援仿真方法、系统、计算机设备及存储介质

应急救援仿真方法生理决策计算机设备团队

面向航空航天领域的开放词汇目标检测方法和装置

样本文本预测类别面向航空航天标签

基于多层推理链验证的大语言模型推理增强方法及系统

推理架构复杂度答案逻辑层级

一种智能座舱多模态语音交互系统和方法

多模态语音智能座舱交互系统意图动态上下文信息

低照度图像增强方法、装置及电子设备

图像增强模型照度图像块图像增强模块图像配准