更全面的具身智能真机评测来了!CVPR 2026 ManipArena挑战赛邀你打榜
更全面的具身智能真机评测来了!CVPR 2026 ManipArena挑战赛邀你打榜过去一年,具身智能领域迎来了爆发式增长。从后空翻到托马斯回旋,从整理衣物到冲泡咖啡……各类令人惊艳的机器人演示视频层出不穷。
过去一年,具身智能领域迎来了爆发式增长。从后空翻到托马斯回旋,从整理衣物到冲泡咖啡……各类令人惊艳的机器人演示视频层出不穷。
2025 年 1 月,特朗普在白宫亲自站台,宣布了一个号称“史上最大 AI 基础设施项目”的宏伟计划。OpenAI 联合软银、甲骨文和阿布扎比主权基金 MGX,组建了一家名为 Stargate LLC 的合资公司,承诺在四年内向美国 AI 基础设施投入 5,000 亿美元。
今天, Anthropic 的 Claude Code 团队工程师 Thariq Shihipar 在 X 上发布了一篇Skills的深度经验分享,帖子在AI/科技圈迅速引发热议。
AGI,究竟如何评判?刚刚,谷歌DeepMind发出重磅论文,直接从认知科学「借」了一套度量衡——把通用智能拆成10大认知能力,配一套三阶段评估协议,还联合Kaggle砸了20万美金,向全球研究者悬赏:谁能测出真正的AGI?
本文是 George Zhang 对 Harness engineering 的解读,原文发布于他的 X(https://x.com/odysseus0z)。
在经典强化学习问题中,动作空间通常是离散且有限的。例如在围棋中,一步棋就是一次行动;在机器人控制或视觉 - 语言 - 行动(VLA)模型中,动作往往来自一个有限的控制指令集合。
模型可以 6 个月迭代一次。Harness 需要系统性的、长时间的打磨。真正的护城河不在模型层,在 Harness 层。 最近因为具体的业务需求,我需要在扣子Coze上落地几个 Workflow 和
3 月 16 日,新加坡 AI 创业公司 Okara 用一条相当简洁的推文介绍了他们新产品:输入你的网站地址,一支 AI 智能体团队就会开始帮你获取流量和用户。
GPT-5.4破纪录了!
自回归视频生成越往后越崩的问题有救了!