只激活3.8B参数,性能比肩同款7B模型!训练微调都能用,来自微软 关键词: 微调,AI,完全稀疏激活,模型训练,人工智能 只需激活60%的参数,就能实现与全激活稠密模型相当的性能。 来自主题: AI技术研报 9194 点击 2024-07-18 16:44