
换掉Transformer,7B开源模型立刻登顶!任意长序列都能处理
换掉Transformer,7B开源模型立刻登顶!任意长序列都能处理只是换掉Transformer架构,立马性能全方位提升,问鼎同规模开源模型!
来自主题: AI资讯
6485 点击 2024-08-13 16:47
只是换掉Transformer架构,立马性能全方位提升,问鼎同规模开源模型!
7B开源模型,数学能力超过了千亿规模的GPT-4!它的表现可谓是突破了开源模型的极限,连阿里通义的研究员也感叹缩放定律是不是失效了。