CVPR'26 | 以机器人为中心的ToM推理框架,从心智推理到决策行动
CVPR'26 | 以机器人为中心的ToM推理框架,从心智推理到决策行动吉林大学&微软亚洲研究院等团队提出MindPower框架,让机器人像人一样理解他人想法并主动帮忙,构建了首个以机器人为中心的心智推理评测体系,通过六层推理链条,让AI不仅看懂场景,更能推断意图、做出决策、执行动作,显著提升助人能力。
搜索
吉林大学&微软亚洲研究院等团队提出MindPower框架,让机器人像人一样理解他人想法并主动帮忙,构建了首个以机器人为中心的心智推理评测体系,通过六层推理链条,让AI不仅看懂场景,更能推断意图、做出决策、执行动作,显著提升助人能力。
当 Transformer 席卷计算机视觉领域,高分辨率图像、超长序列任务带来的算力与显存瓶颈愈发凸显:标准 Softmax 注意力的二次复杂度,让 70K+token 的超分辨率任务直接显存爆炸,高分辨率图像分割、检测的推理延迟居高不下。
最近AI圈又多了一张硬核通行证,Anthropic刚刚在官网发布了Claude首个AI架构师认证。
近年来,多模态大模型(Multimodal Large Language Models, MLLMs)正在迅速改变人工智能的能力边界。从图像理解到视频分析,从语音对话到复杂推理,大模型正在逐步具备类似人类的综合感知能力。但一个关键问题仍然没有得到充分回答:这些模型真的能够理解人类情绪吗?
Karpathy让AI通宵干活,自己去蒸桑拿了。
OpenAI刚刚开除了一名员工,原因令人瞠目:此人利用公司核心机密,在Polymarket等预测市场上疯狂下注牟利。更炸裂的是,调查发现这绝非个例——过去一年多,60个神秘钱包做出了77次精准到离谱的「内幕押注」。
大家好,我是袋鼠帝。 我最近做了一个挺有意思的实验。
vibe coding这个词,是一年前Karpathy造的,现在他自己不用了。110次实验,AI Agent自主跑完,全程没碰键盘,顺带还搭了套家庭监控分析系统。Box CEO Levie看完说了一句话:专家不会消失,但专家能做到的事,边界变了。
重要的还是和工作场景打通。 作者|金光浩 编辑|靖宇 前几天,腾讯门口一张公益代装 OpenClaw 的照片,在朋友圈刷屏了。 更离谱的是,OpenClaw 创始人亲自下场转发:「中国的 OpenCl
Reducto 在去年 6 个月内接连完成分别由 Benchmark 与 a16z 领投的两轮融资,估值翻了 3 倍,达到 6 亿美元。我们认为,Reducto 切中了 AI 应用走向生产环境过程中的“精确数据摄取”瓶颈。