
国内首个支付MCP来了 AI应用可一键调用支付宝
国内首个支付MCP来了 AI应用可一键调用支付宝AI智能体如何更好连接现实世界,正成为不少人关心的命题。
AI智能体如何更好连接现实世界,正成为不少人关心的命题。
移动GUI自动化智能体V-Droid采用「验证器驱动」架构,通过离散化动作空间并利用LLM评估候选动作,实现了高效决策。在AndroidWorld等多个基准测试中任务成功率分别达到59.5%、38.3%和49%,决策延迟仅0.7秒,接近实时响应。
人和智能体共享奖励参数,这才是强化学习正确的方向?
发现了一个很炫酷、完成度很高的用户洞察 agent,叫 atypica.ai
AI Agent 领域也存在 scaling law,甚至还在加速。
在现实世界中,如何让智能体理解并挖掘 3D 场景中可交互的部位(Affordance)对于机器人操作与人机交互至关重要。所谓 3D Affordance Learning,就是希望模型能够根据视觉和语言线索,自动推理出物体可供哪些操作、以及可交互区域的空间位置,从而为机器人或人工智能系统提供对物体潜在操作方式的理解。
昨天晚上,Google发了一个关于Agent的新开放协议。
AI大模型在咖啡店怎么落地?
谷歌重磅发布第七代TPU Ironwood,专为推理设计,性能较从初代飙升3600倍,可与英伟达B200一较高下。不仅如此,谷歌还带来了Veo 2等多款模型全新升级,就连「谷歌版」MCP协议也公布了。
LLM Agent 火了两年了,但业界仍然存在许多非共识。智能体数量卷上去了,概念炒上去了,但质量参差不齐,娱乐向的不好玩,提效向的不好用,具体企业落地更是各种大小问题不断。