AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
Harness,才是Agent时代统管一切的基座|交大综述解读Memory、Skills、Protocols

Harness,才是Agent时代统管一切的基座|交大综述解读Memory、Skills、Protocols

Harness,才是Agent时代统管一切的基座|交大综述解读Memory、Skills、Protocols

2026年再看Agent,一个越来越难回避的事实是:能力正在从模型里流到模型外。真正决定系统上限的,不再只是参数、Prompt和tool calling,而是记忆、技能、协议以及统摄这一切的harness。

来自主题: AI技术研报
8997 点击    2026-04-14 14:57
二元成功率已经过时!PRM-as-a-Judge才是你需要的具身操作评测框架

二元成功率已经过时!PRM-as-a-Judge才是你需要的具身操作评测框架

二元成功率已经过时!PRM-as-a-Judge才是你需要的具身操作评测框架

随着机器人操作从短程、单步技能逐步走向长程、富接触、需要持续协调与恢复能力的复杂任务,传统以二元成功率为核心的评测方式开始暴露出明显局限。它能够回答 “任务是否完成”,却难以回答 “策略推进到了哪里”“执行过程是否高效稳定”“失败究竟发生在什么阶段”。

来自主题: AI技术研报
8934 点击    2026-04-14 14:57
清华2年前预言,正成为全球共识!Meta等三大AI机构已得出同一结论

清华2年前预言,正成为全球共识!Meta等三大AI机构已得出同一结论

清华2年前预言,正成为全球共识!Meta等三大AI机构已得出同一结论

太疯狂了!Meta和METR刚测出的AI进化数据,与中国团队两年前提出的「密度定律」完美重合。硅谷猛然回头,发现中国研究者在这条路上已领先两年!

来自主题: AI技术研报
8574 点击    2026-04-14 09:11
OpenAI也开始恐惧自己训练出的新模型了

OpenAI也开始恐惧自己训练出的新模型了

OpenAI也开始恐惧自己训练出的新模型了

看到 Anthropic 内测中的下一代旗舰模型 Mythos 强大的网络攻防能力带来的巨大影响和讨论度,奥特曼坐不住了,也计划内测 OpenAI 具有强大的网络攻防能力的 AI。

来自主题: AI资讯
8715 点击    2026-04-14 09:11
全错!谷歌实锤AI越乖洗脑越深,现行安全指标沦为废纸

全错!谷歌实锤AI越乖洗脑越深,现行安全指标沦为废纸

全错!谷歌实锤AI越乖洗脑越深,现行安全指标沦为废纸

Google DeepMind调查了一万个人,结果让整个AI安全评估体系汗颜:AI做了三倍多的「坏事」,但造成的实际伤害几乎一样。这意味着,我们现在用来证明AI安全的那套逻辑,可能从一开始就是错的。

来自主题: AI资讯
8639 点击    2026-04-14 09:10
统一VLA范式!港科大开源StarVLA乐高式架构,复现成本大幅降低

统一VLA范式!港科大开源StarVLA乐高式架构,复现成本大幅降低

统一VLA范式!港科大开源StarVLA乐高式架构,复现成本大幅降低

当前具身智能的VLA(Vision-Language-Action)赛道正陷入典型的「碎片化」泥潭:不同团队采用异构的动作解码范式、强耦合的数据管线、互不兼容的评测协议,导致方法难以横向对比,复现成本极高。

来自主题: AI技术研报
8938 点击    2026-04-14 08:42
港大×复旦×上交:视触觉融合+闭环纠错,让机器人双臂协作不再「盲操」

港大×复旦×上交:视触觉融合+闭环纠错,让机器人双臂协作不再「盲操」

港大×复旦×上交:视触觉融合+闭环纠错,让机器人双臂协作不再「盲操」

在具身智能快速发展的今天,高质量数据已成为驱动能力提升的关键基础,然而一个核心问题也随之而来: 如何让机器人数据采集更快、更稳、更有效?

来自主题: AI技术研报
6001 点击    2026-04-14 08:41
迎接范式革命:最新、最全的大模型Latent Space综述,NUS、复旦、清华等联合出品

迎接范式革命:最新、最全的大模型Latent Space综述,NUS、复旦、清华等联合出品

迎接范式革命:最新、最全的大模型Latent Space综述,NUS、复旦、清华等联合出品

从 2024 年底的关于潜在空间的早期探索,再到 2025 年底和 2026 年初的相关研究爆发,潜空间范式正在彻底重塑大模型 (LLMs, VLMs, VLAs 等延伸模型) 的底层设计逻辑。

来自主题: AI技术研报
7464 点击    2026-04-13 14:31
Harness 刚火,可能就要成为过去时了|Hao好聊论文

Harness 刚火,可能就要成为过去时了|Hao好聊论文

Harness 刚火,可能就要成为过去时了|Hao好聊论文

随着任务的复杂度提升,Agent(智能体)的上下文在无限膨胀。在无穷的历史对话、工具调用输出、中间步骤以及报错信息中,模型迷糊了,于是开始跳步、忽视、绕道。

来自主题: AI技术研报
8105 点击    2026-04-13 13:51