基于参数高效模块和多教师知识蒸馏的知识蒸馏方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于参数高效模块和多教师知识蒸馏的知识蒸馏方法
申请号:CN202410860737
申请日期:2024-06-28
公开号:CN118747507B
公开日期:2025-02-11
类型:发明专利
摘要
本发明公开了一种基于参数高效模块和多教师知识蒸馏的知识蒸馏方法,所述方法包括:获取下游任务数据集,根据预先构建的参数高效性多教师模型生成多个子教师模型,对每个子教师模型进行微调,得到多个微调子教师模型;根据下游任务数据集对待训练的学生模型进行训练,根据下游任务数据集和多个微调子教师模型生成该次训练的监督信号,根据监督信号和学生模型在该次训练过程中得到的训练结果,更新参数,当达到预设训练条件时,得到并输出训练完成的学生模型;获取目标处理数据,将目标处理数据输入到训练完成的学生模型,输出目标结果。本发明可以在训练学生模型时兼顾效率和准确率,从而通过训练好的学生模型生成准确的目标结果。
技术关键词
教师 知识蒸馏方法 加权损失函数 学生 参数 数据 门控制单元 预训练模型 蒸馏系统 信号 模型训练模块 可读存储介质 处理器 程序 输出模块 存储器 计算机 机制