
400万token上下文、推理再加速46%!最新开源方案升级MIT成果,推理成本再降低
400万token上下文、推理再加速46%!最新开源方案升级MIT成果,推理成本再降低22倍加速还不够,再来提升46%,而且方法直接开源!这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。
22倍加速还不够,再来提升46%,而且方法直接开源!这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。
一个来自MIT博士生的惊人发现:只需对Transformer的特定层进行一种非常简单的修剪,即可在缩小模型规模的同时显著提高模型性能。
在AI的帮助下,MIT科学家解锁了60年以来的第一批用于对抗金黄色葡萄球菌的新抗生素!
11月29、30日,第八届·灵眸大赏Morketing Summit在中国·上海成功召开。
MIT、微软联合研究:不需要额外训练,也能增强大语言模型的任务性能并降低其大小。
过度训练让中度模型出现了结构泛化能力。
最近,由CMU/MIT/清华/Umass提出的全球首个生成式机器人智能体RoboGen,可以无限生成数据,让机器人7*24小时永不停歇地训练。AIGC for Robotics,果然是未来的方向。
「AI灭绝人类」的全球讨论继续升级,Sam Altman在剑桥活动现场被抗议者当面抵制!而LeCun、吴恩达的「开源派」和Bengio、马库斯的 「毁灭派」,也纷纷甩出言辞恳切的联名信,继续征集签名中。
新型材料的研发历程就有点像人们去「沙滩」上捡「贝壳」,这些「贝壳」可能用传统的方法很难发掘,但 AI for Science(简称 AI4S)为我们带来了新的可能。
在大语言模型内部,是否有一个世界模型?LLM是否具有空间感?并且在多个时空尺度上都是如此? 最近,MIT的几位研究者发现,答案是肯定的!