
超大模型推理加速2.18倍!SGLang联合美团技术团队开源投机采样训练框架
超大模型推理加速2.18倍!SGLang联合美团技术团队开源投机采样训练框架专门适用超大模型、带来2.18倍推理加速,最新投机采样训练框架开源! SGLang团队联合美团搜推平台、Cloudsway.AI开源SpecForge。
专门适用超大模型、带来2.18倍推理加速,最新投机采样训练框架开源! SGLang团队联合美团搜推平台、Cloudsway.AI开源SpecForge。
前几天,Kimi 彻底开源了它的旗舰模型Kimi K2。不仅代码、权重全免费,还放出MIT许可,任企业随便商用。
模型落地中国芯取得关键突破!这得益于一个AI开源社区,以生态协作之力打通了AI落地的最后一公里。目前已有上千模型成功适配国产算力。从此,国产算力孤岛彻底打破,众多AI厂商积极上车,开发者狂喜!
「造芯」不易,「用芯」更难。大模型加速落地,国产芯片需求日盛,但模型真正能在国产芯上「开箱即用」者寥寥无几——这关键的「最后一公里」,谁来铺路?
奥特曼宣布无限期推迟OpenAI开源模型发布。与此同时,竞争对手正高调上新,开源赛道硝烟四起。这次跳票不仅令开发者和科技爱好者失望,也让外界再次质疑OpenAI在「Open」与商业利益之间的身份撕裂与信任危机。
2025年上半年,AI开源领域的竞赛异常激烈,主要围绕着几个核心方向展开:首先是效率竞赛,各路玩家不再单纯追求千亿、万亿参数的“巨无霸”模型,而是更专注于通过新架构和训练方法,用更小的参数实现更强的性能。其次,多模态已成标配,纯文本模型越来越少,新发布的旗舰模型几乎都具备了处理图像、视频等多种信息的能力。
最近,看到各大厂商,在不断地将自己的AI大模型进行开源。华为宣布开源:盘古7B稠密和72B混合专家模型。
2025 年 6 月 13 日,由中国开源软件推进联盟(COPU)主办的第二十届“开源中国开源世界”大会在北京隆重召开。大会以“共建人工智能时代的开源生态”为主题,邀请了来自国内外近 30 位 AI 与开源领域专家学者,共同探讨如何在技术变革与产业升级交织的时代背景下,推动开源 AI 生态体系的协同演进与持续繁荣。
“当我们看到这些数据趋势的时候,一个词浮现在我的眼前——黑客松(Hackathon),AI 领域的项目,快速地出现、快速地停更,他们似乎在做一场真实市场里的黑客松,那么,什么领域涌现了最多项目,哪些方面是停更的重灾区,哪些项目幸存了,激烈竞争的项目们如今怎么样了,我们都尝试着在这份趋势报告里叙述一二。”
2025年,ChatGPT依旧领跑,但DeepSeek、Qwen等开源劲敌正加速追赶。从「推理革命」爆发到 DeepSeek开源,一场围绕算力、架构与生态的战争已悄然打响,开源势力正以星星之火之势挑战闭源巨头。