CVPR 2026|清华联合美团推出3DThinker,首个用3D意象思考的工作
CVPR 2026|清华联合美团推出3DThinker,首个用3D意象思考的工作大家是否有这样的感觉?给定几张场景中拍摄的图片,往往能够在脑海中想象出这个场景的三维布局,然而当前的多模态大模型还停留于纯文本或者 2D 视觉的推理表示,限制了图像中隐含几何结构的表达能力。
大家是否有这样的感觉?给定几张场景中拍摄的图片,往往能够在脑海中想象出这个场景的三维布局,然而当前的多模态大模型还停留于纯文本或者 2D 视觉的推理表示,限制了图像中隐含几何结构的表达能力。
扩散模型终于学会“看题下菜碟”了!
1984年,教育心理学家本杰明·布鲁姆(Benjamin Bloom)的一项实验,揭示了一个惊人的事实:接受一对一辅导的学生,成绩可以超越传统班级里98%的同学。这种效果被称为两个标准差优势,它证明了个性化教学的巨大潜力。但它也带来了一个现实难题:一对一辅导成本极高,无法普及。
用强化学习微调扩散模型,还有更好的办法吗?
NUS、ZJU、UW、Stanford、CUHK 联合提出 「ThinkMorph」,主张让文字与图像在统一架构里「原生协作」、「共同演化」,而不是像当下大多数多模态模型那样,看完图像就闭上眼睛,后续完全靠文字链条推进。仅用 2.4 万条数据微调 7B 统一模型,视觉推理平均提升 34.74%,多项任务比肩甚至超越 GPT-4o 和 Gemini 2.5 Flash。
微信,终于不再躺平了。 就在刚刚,据 The Information 独家爆料,腾讯正在打造一款「绝密级」AI 智能体,直接内嵌进微信,能够帮你打车、买菜、订机票、全程代劳的「真·生活管家」。 这也意味着,14 亿月活用户即将拥有一个能动手绝不动口的超级助理。
刚刚,据多家媒体报道,Moltbook 这场轰轰烈烈的全网社会实验被 Meta 端走了。是的,Meta 已经正式收购了专为 AI 智能体打造的社交网络 Moltbook,并将该平台的两位核心创作者 Matt Schlicht 和 Ben Parr 招致麾下。
Dify 完成了 3000 万美元 Pre-A 轮融资,由红杉领投,GL Ventures、Alt-Alpha Capital(Bessemer Venture Partners 新孵化基金)、五源资本、瑞穗力合投资和 NYX Ventures 跟投。
3 月 10 日,APPSO 中文独家获悉,世界模型研究所/创业公司 AMI 已完成 10.3 亿美元融资,投前估值 35 亿美元。该公司由图灵奖得主、前 Meta 首席 AI 科学家杨立昆 (Yann LeCun) 创办。
猛料又来了,为了在24小时内打击伊朗的1000个目标,美国军方让Claude跟军方的Maven系统合作,提供目标建议,找到了精确的位置坐标!早在2021年美军撤军阿富汗时,Maven就被使用过。现代战争,已被AI重塑。