LaPha:你的Agent轨迹其实嵌入在一个Poincaré球?
LaPha:你的Agent轨迹其实嵌入在一个Poincaré球?在经典强化学习问题中,动作空间通常是离散且有限的。例如在围棋中,一步棋就是一次行动;在机器人控制或视觉 - 语言 - 行动(VLA)模型中,动作往往来自一个有限的控制指令集合。
在经典强化学习问题中,动作空间通常是离散且有限的。例如在围棋中,一步棋就是一次行动;在机器人控制或视觉 - 语言 - 行动(VLA)模型中,动作往往来自一个有限的控制指令集合。
模型可以 6 个月迭代一次。Harness 需要系统性的、长时间的打磨。真正的护城河不在模型层,在 Harness 层。 最近因为具体的业务需求,我需要在扣子Coze上落地几个 Workflow 和
刚刚,一篇阿里联合中山大学的研究在 X 上爆火了!
AI 基础设施公司 Nscale 宣布完成 20 亿美元的 C 轮融资,由 Aker ASA 和 8090 Industries 领投。此次融资使公司估值达到 146 亿美元。参与本轮融资的其他投资者包括 Astra Capital Management、Citadel(城堡投资)、戴尔、Jane Street、联想、Linden Advisors、诺基亚、英伟达以及 Point72。
OpenClaw,是当下最火的开源个人 AI 助手。很多人不知道的是,OpenClaw 背后,核心是一个极简框架 Pi-coding-agent。
过去两天,全球爆火的 Agent 私人助手 OpenClaw,接连更新了两个版本,让人直呼「开发团队是不睡觉了吗?」
3月17日,楽天(乐天)集团正式发布了Rakuten AI 3.0模型,号称是“日本国内最大规模的高性能AI模型”。官方宣传的参数量为约7000亿,并且日语特化,Apache 2.0开源许可,还拿了日本经产省和NEDO的GENIAC项目补助。
Meta 收购 AI 社交平台 Moltbook 仅五天,便紧急修改规则,彻底终结了 AI 自治。新条款明确警告:人类必须为 Agent 的所有行为承担唯一法律责任。巨头入局 AI社交的第一件事,就是把风险塞回给人类。
腾讯最近在AI Agent领域的一波操作堪称“凭亿近人”的典型案例:先被OpenClaw(俗称“龙虾”)创始人Peter Steinberger公开指责“抄袭”,几天后直接砸钱成为官方赞助商,剧情反转之快让人直呼“爱看救赎弧线”。
我们用 Codex 改变了维护 OpenAI Agents SDK[1] 仓库的方式。仓库本地的技能(skills)、AGENTS.md 文件和 GitHub Actions,让我们把反复出现的工程工作——验证、发布准备、示例集成测试、PR 审查,变成了可重复执行的工作流。