致敬Kimi K2:基于slime的全流程INT4量化感知RL训练
致敬Kimi K2:基于slime的全流程INT4量化感知RL训练受 Kimi K2 团队启发,SGLang RL 团队成功落地了 INT4 量化感知训练(QAT) 流程方案。通过 “训练端伪量化 + 推理端真实量化(W4A16)” 的方案组合,我们实现了媲美 BF16 全精度训练的稳定性与训推一致性,
受 Kimi K2 团队启发,SGLang RL 团队成功落地了 INT4 量化感知训练(QAT) 流程方案。通过 “训练端伪量化 + 推理端真实量化(W4A16)” 的方案组合,我们实现了媲美 BF16 全精度训练的稳定性与训推一致性,
目前已经出现了一些早期迹象,通用LLM助手领域的市场格局,正朝着“赢家通吃”,至少是“赢家通吃大部分市场”的趋势发展。在ChatGPT、Gemini、Claude 3和Cursor这几款产品中,仅有9%的用户会为一款以上的产品付费。
昨天,那个硅谷少有的“横跨三代技术浪潮、持续站在牌桌中央、系统性改写投资规则”的传奇人物,终于又一次出来公开说他的大实话了!
2026 年,基模会不会吃掉所有应用场景?
2025年,AI终于从实验室冲进你的手机、浏览器,甚至购物车——但别被热闹骗了:赢家通吃的游戏从未如此真实。在 Andreessen Horowitz(a16z)最新发布的《2025消费级AI现状》年终报告中,我们看到一场表面百花齐放、实则高度集中的军备竞赛:ChatGPT 依然稳坐王座,Gemini 凭借一张“香蕉图”狂飙突进,而大多数用户——超过90%——根本懒得切换第二款AI。
欧洲音频公司 Mirelo AI 刚刚拿下 4100 万美元种子轮,由 a16z 与 Index Ventures 领投。他们不是再做一个剪辑工具,而是训练自己的音频模型,主打用户给视频,Mirelo 补上所有声音。自动生成音效与配乐,并把它们精确同步到画面上。
你还记得小时候玩电子宠物的感觉吗?每天按时喂食、陪它玩耍、看着它一天天长大,那种责任感和成就感让人上瘾。一家叫 First Voyage 的创业公司正在做这样的事情。他们开发的 AI 伴侣应用 Momo Self Care 刚刚完成了 250 万美元的种子轮融资
AI 让每个人都能制作视频,但许多 AI 视频创作工具缺乏音频支持。Mirelo 正在开发能根据视频内容匹配音效的 AI 技术。
我一直认为,互联网最大的悖论就在于此:信息从未如此丰富,但真正有效的学习却从未如此困难。直到最近,我注意到一家叫 Oboe 的公司刚刚完成了 1600 万美元的 A 轮融资,由 a16z 领投。
关键在于,从加入那一刻起,你就能对公司产生影响。因此在团队中,你可能承担任何角色。资历长短不会决定你在层级中的位置。只要足够聪明、敏捷且充满热情,就能快速提升自我——这点确实很有帮助。