可微奖励就该直接微调!用HJB方程颠覆流匹配对齐|NeurIPS'25
可微奖励就该直接微调!用HJB方程颠覆流匹配对齐|NeurIPS'25用强化学习微调扩散模型,还有更好的办法吗?
用强化学习微调扩散模型,还有更好的办法吗?
微信,终于不再躺平了。 就在刚刚,据 The Information 独家爆料,腾讯正在打造一款「绝密级」AI 智能体,直接内嵌进微信,能够帮你打车、买菜、订机票、全程代劳的「真·生活管家」。 这也意味着,14 亿月活用户即将拥有一个能动手绝不动口的超级助理。
刚刚,据多家媒体报道,Moltbook 这场轰轰烈烈的全网社会实验被 Meta 端走了。是的,Meta 已经正式收购了专为 AI 智能体打造的社交网络 Moltbook,并将该平台的两位核心创作者 Matt Schlicht 和 Ben Parr 招致麾下。
Dify 完成了 3000 万美元 Pre-A 轮融资,由红杉领投,GL Ventures、Alt-Alpha Capital(Bessemer Venture Partners 新孵化基金)、五源资本、瑞穗力合投资和 NYX Ventures 跟投。
3 月 10 日,APPSO 中文独家获悉,世界模型研究所/创业公司 AMI 已完成 10.3 亿美元融资,投前估值 35 亿美元。该公司由图灵奖得主、前 Meta 首席 AI 科学家杨立昆 (Yann LeCun) 创办。
猛料又来了,为了在24小时内打击伊朗的1000个目标,美国军方让Claude跟军方的Maven系统合作,提供目标建议,找到了精确的位置坐标!早在2021年美军撤军阿富汗时,Maven就被使用过。现代战争,已被AI重塑。
如果有价值 $100 万美金的顶级专家任务,AI 能完成其中多少?
微软选择了 Anthropic,而不是 OpenAI。
37位来自OpenAI、谷歌的AI科学家发文声援。
用「无本体数采」的方式训练具身模型,灵初智能的这条路径是 VLA 之后行业最热的方向之一。