Generalist之后,罗剑岚团队推出LWD,也要变革具身智能训练范式
Generalist之后,罗剑岚团队推出LWD,也要变革具身智能训练范式智元机器人的办公室里,最近员工们一上班就能看到机器人熟练地切着水果:这么全面的能力是如何做到的?答案是直接在真实环境中搞大规模分布式强化学习训练。它们使用的是全新的具身智能训练范式:面向通用机器人策略的分布式多机强化学习(LWD)。这一套技术捅破了当前VLA的「天花板」。
智元机器人的办公室里,最近员工们一上班就能看到机器人熟练地切着水果:这么全面的能力是如何做到的?答案是直接在真实环境中搞大规模分布式强化学习训练。它们使用的是全新的具身智能训练范式:面向通用机器人策略的分布式多机强化学习(LWD)。这一套技术捅破了当前VLA的「天花板」。
今天凌晨,谷歌母公司Alphabet公布2026财年第一季度财报。本财季,营收和净利润超出市场预期,营收达1098.96亿美元(约合人民币7506亿元),同比增长22%,按固定汇率计算同比增长19%,实现连续11个季度的两位数增长;归母净利润625.78亿美元(约合人民币4274亿元),同比暴增81%;摊薄EPS 5.11美元,同比增长82%。
来自华为泰勒实验室、北京大学和上海财经大学的研究团队提出了 SHAPE(Stage-aware Hierarchical Advantage via Potential Estimation),给推理链装上了一套「里程碑 + 推理税」机制——不仅告诉模型每一步推得对不对,还让它为啰嗦付出代价。结果是:准确率平均提升 3%,token 消耗直降 30%。
据The Verge等多家外媒报道,今天凌晨,埃隆·马斯克(Elon Musk)与OpenAI CEO萨姆·奥尔特曼(Sam Altman)的世纪庭审在加州奥克兰联邦法院进入开庭陈词阶段。当天,马斯克身穿黑色西装、系黑色领带,出现在联邦法院。马斯克方、OpenAI方与微软方依次发表开庭陈词,随后马斯克作为本案第一证人进行举证。
你敢信?一个活在95年前的AI,竟写出了Python代码。GPT之父下场,用2600亿Token炼出了一个「老古董」AI——「talkie」。
就在这一背景下,银河通用联合清华北大英伟达等众多机构联合发布了跨本体「隐式世界-动作基础模型」LDA-1B,将目光投向了具身智能 Scaling Law 的这个终极命题:如何让模型有效利用互联网规模的异构数据。
新加坡国立大学 Bingsheng He 教授团队一篇最新入选 ICLR 2026 Oral 的论文,把视角放在了一个更贴近日常使用场景的问题上:人们更熟悉的,是用户故意诱导模型说假话的情形;而这篇工作真正追问的是,在没有刻意诱导、只是正常提问的情况下,模型会不会也出现某种 “表面这样答,实际那样想” 的现象。
AlphaGo 之父 David Silver 创办的 Ineffable Intelligence 获 11 亿美元种子轮,创欧洲融资纪录,估值达 51 亿美元。这家公司押注强化学习和自我经验学习,试图挑战依赖 Scaling Law 的大模型主线。
今天,马斯克起诉OpenAI及其CEO萨姆·奥尔特曼(Sam Altman)、总裁格雷格·布罗克曼(Greg Brockman)一案,在美国加州奥克兰联邦法院正式开庭。
Shade 完成了 1400 万美元 融资。本轮由 Khosla Ventures、Construct Capital 与 Bling Capital 共同领投,公司累计融资达到 2000 万美元。如果只看功能,这是一个支持自然语言搜索视频素材的存储工具;但从更底层来看,它试图重写的是一个更基础的前提——内容在组织内部是如何存在、被理解以及被再次使用的。