针对视觉大模型的蒸馏和图像识别方法、设备、装置及程序

申请号：CN202411684539

申请日期：2024-11-22

公开号：CN119600411B

公开日期：2025-12-09

类型：发明专利

摘要

本发明提供了一种针对视觉大模型的蒸馏方法，包括：获取教师模型，所述教师模型是具有Transformer结构的视觉大模型；对所述教师模型进行结构剪枝，生成多个辅助模型；利用优化损失函Loss数通过参数共享方式优化训练所述教师模型和多个所述辅助模型；在优化后的多个所述辅助模型中选取综合得分最高的为选定辅助模型；利用优化损失函数训练所述选定辅助模型和学生模型，得到最终的学生模型。利用本发明的技术方案，可将模型知识从全尺度的教师模型尽可能传递到学生模型，使得学生模型在规模和性能上达到最佳，该学生模型的规模足够小，能方便地嵌入到实际的应用设备中。

技术关键词

蒸馏方法教师学生图像识别单元图像识别方法生成超声图像视觉图像生成单元图像识别装置图像识别模块图像获取模块蒸馏装置注意力规模处理器参数标签

系统为您推荐了相关专利信息

井下图像识别模型训练方法、装置及电子设备

学生老师蒸馏可执行程序代码计算机执行指令

一种中高职教学改革辅助方法及其系统

节点知识点数据时序构建知识图谱

一种基于体渲染知识蒸馏的在线矢量地图构建方法及装置

矢量地图语义特征二维图像数据学生教师

一种基于知识蒸馏的复杂环境下电压计量可靠性评估方法

可靠性评估方法深度神经网络模型训练深度神经网络表达式深度神经网络建模

一种基于人工智能技术的幼儿对话系统

幼儿对话系统人工智能机器人数据储存模块教师