单GPU就能压缩模型,性能不变参数少25%!微软提出模型稀疏化新方法
单GPU就能压缩模型,性能不变参数少25%!微软提出模型稀疏化新方法大语言模型之大,成本之高,让模型的稀疏化变得至关重要。
来自主题: AI技术研报
4818 点击 2024-02-21 16:51
大语言模型之大,成本之高,让模型的稀疏化变得至关重要。
删除权重矩阵的一些行和列,让 LLAMA-2 70B 的参数量减少 25%,模型还能保持 99% 的零样本任务性能,同时计算效率大大提升。这就是微软 SliceGPT 的威力。