致敬Kimi K2:基于slime的全流程INT4量化感知RL训练
致敬Kimi K2:基于slime的全流程INT4量化感知RL训练受 Kimi K2 团队启发,SGLang RL 团队成功落地了 INT4 量化感知训练(QAT) 流程方案。通过 “训练端伪量化 + 推理端真实量化(W4A16)” 的方案组合,我们实现了媲美 BF16 全精度训练的稳定性与训推一致性,
受 Kimi K2 团队启发,SGLang RL 团队成功落地了 INT4 量化感知训练(QAT) 流程方案。通过 “训练端伪量化 + 推理端真实量化(W4A16)” 的方案组合,我们实现了媲美 BF16 全精度训练的稳定性与训推一致性,
Claude Code 团队分享的 10 条内部技巧,已经很多人分享过了,大部分我还是结合自己经验解读一下。
面对同行评审,许多作者都有过这样的经历:明明回答了审稿人的每一个问题,态度也足够谦卑,为什么最终还是没能打动对方?
2026 年才开了个头,网络社交就有了大大小小的变化——都拜 AI 所赐。
何恺明团队新论文,再次「大道至简」。
OpenAI 发布 Codex macOS 应用,作为 AI 智能体指挥中心,并全面翻倍付费用户速率限制。
不久前在 AGI-Next 前沿峰会上,姚顺雨曾分享过一个核心观点:模型想要迈向高价值应用,核心瓶颈就在于能否「用好上下文(Context)」。
今天,马斯克旗下商业航天巨头SpaceX正式官宣收购马斯克AI大模型独角兽xAI!据外媒报道,知情人士透露,SpaceX以2500亿美元(约合人民币1.7万亿)股票收购了xAI,合并后SpaceX的估值达到1.25万亿美元(约合人民币8.68万亿元)。
Clawdbot火爆全球,国产算力却不能用?AI Agent迎来高光时刻:Ollama只支持CUDA,中国团队直接把国产版开源了!正面硬刚Ollama,5分钟让国产芯片跑通OpenClaw!
AI,是色盲吗?
技术平权时代到来,AI漫剧成为文化出海新窗口。
有时,你或许正手握热门产品而不自知,直到市场需求显现。
太带劲了!抢先Claude 5,OpenAI深夜祭出了一个编码杀器——Codex。它可以让一人指挥多Agent并行协作,自带Skills,编码从此进入自动化时代。
“80%的手机App会被吃掉!”
硬氪独家获悉,人形机器人公司逐际动力LimX Dynamics已完成2亿美元的B轮融资。
救命,现在的AI,光会帮我下单已经不够了。
这两天我在扫 X 推文的时候,有一个名字出现的频率明显变高了:Fanvue,一个创作者订阅平台。
为了给OpenAI凑齐3000亿美金的算力投名状,硅谷老教父Larry Ellison杀疯了!3万名员工集体祭天,283亿美金买回来的医疗巨头Cerner直接送上拍卖台。为了买显卡,甲骨文正在自残?
上周末,号称「AI 版 Reddit」的 Moltbook 闹得沸沸扬扬。
企业 AI 转型,再也不需要自建 agent 了
让模型真正 “能行动”,往往需要一个可执行、可验证的符号世界模型(Symbolic World Model):它不是抽象的文字描述,而是能被规划器或执行器直接调用的形式化定义 —— 例如 PDDL 领域 / 问题,或可运行的环境代码 / 模拟器。
不做 VLA;不做遥操,以可穿戴设备采真实数据。
Clawdbot(现改名为 OpenClaw) 体验下来,持久的记忆管理系统很是让人惊艳——全天候保持上下文,无限期地记住对话并在此基础上持续深化互动。
“我们相信,AI 会重塑所有产品。”
何恺明,再次出手精简架构。
OpenClaw、Moltbook彻底火了。
如果将一台在视觉语言导航(VLN)任务中表现优异的机器人直接搬进家庭场景,往往会遇到不少实际问题。
2月2日,X上一位的知名AI博主Pankaj Kumar (@pankajkumar_dev),爆料了Anthropic的下一代旗舰模型Claude Sonnet 5。这个模型代号为“Fennec”,可能在明天或者后天就要正式发布了。
就在刚刚,据《南华早报》援引知情人士最新消息,智谱 AI 计划在未来两周内,也就是春节前发布其新旗舰模型 GLM-5。与此同时,MiniMax 也预计将于春节前发布 M2.2 模型,这是在原有 M2.1 基础上进行的小幅更新,重点提升编程能力。