AI资讯新闻榜单内容搜索-BitDistill

微软BitDistill将LLM压缩到1.58比特：10倍内存节省、2.65倍CPU推理加速

大语言模型（LLM）不仅在推动通用自然语言处理方面发挥了关键作用，更重要的是，它们已成为支撑多种下游应用如推荐、分类和检索的核心引擎。尽管 LLM 具有广泛的适用性，但在下游任务中高效部署仍面临重大挑战。

来自主题: AI技术研报

7607 点击 2025-10-21 11:43

1.58bit量化，内存仅需1/10，但表现不输FP16？微软最新推出的蒸馏框架BitNet Distillation（简称BitDistill），实现了几乎无性能损失的模型量化。

来自主题: AI技术研报

7455 点击 2025-10-20 14:35