
模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步
模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步知识蒸馏通过训练一个紧凑的学生模型来模仿教师模型的 Logits 或 Feature Map,提高学生模型的准确性。迁移学习则通常通过预训练和微调,将预训练阶段在大规模数据集上学到的知识通过骨干网络共享应用于下游任务。
来自主题: AI技术研报
3397 点击 2025-01-28 11:57
知识蒸馏通过训练一个紧凑的学生模型来模仿教师模型的 Logits 或 Feature Map,提高学生模型的准确性。迁移学习则通常通过预训练和微调,将预训练阶段在大规模数据集上学到的知识通过骨干网络共享应用于下游任务。