不改模型、不降质量,谷歌让Gemma 4快了3倍:本地跑大模型彻底变天
不改模型、不降质量,谷歌让Gemma 4快了3倍:本地跑大模型彻底变天谷歌刚刚给Gemma 4家族更新了一项关键能力:Multi-Token Prediction(MTP)推测解码架构,推理速度最高提升3倍,输出质量不变。
来自主题: AI资讯
8737 点击 2026-05-06 14:56
搜索
谷歌刚刚给Gemma 4家族更新了一项关键能力:Multi-Token Prediction(MTP)推测解码架构,推理速度最高提升3倍,输出质量不变。