AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
警惕!大模型成本倒挂:你正在为模型的多余「思考」买单

警惕!大模型成本倒挂:你正在为模型的多余「思考」买单

警惕!大模型成本倒挂:你正在为模型的多余「思考」买单

在选择使用大模型 (LLM) 时,除了模型性能强弱,价格也是一个重要指标。人们通常会用大模型的 API 定价更贵或更便宜,来比较模型的价格高低。但事实上,定价低的模型真的比定价高的模型使用起来更便宜吗?

来自主题: AI技术研报
6190 点击    2026-04-15 09:45
吞吐提升76%!小红书开源RL训练引擎Relax

吞吐提升76%!小红书开源RL训练引擎Relax

吞吐提升76%!小红书开源RL训练引擎Relax

小红书AI平台团队刚刚开源了Relax——一个为全模态数据、Agentic工作流和大规模异步训练协同设计的现代RL训练引擎!实测全异步Off-Policy模式相比共卡On-Policy吞吐提升76%,相比veRL的全异步实现提升20%!

来自主题: AI技术研报
6297 点击    2026-04-15 09:23
头号玩家照进现实!NTU发布世界模型交互新范式,攻克主动操作难题

头号玩家照进现实!NTU发布世界模型交互新范式,攻克主动操作难题

头号玩家照进现实!NTU发布世界模型交互新范式,攻克主动操作难题

南洋理工大学MMLab团队推出Hand2World,让AI世界模型真正「伸手」互动。只需在空中比划手势,模型就能生成逼真第一人称交互视频,实时响应调整。它摒弃旧有遮挡误导,用3D手部结构与射线编码解耦手与头运动,首次实现闭环持续交互。

来自主题: AI技术研报
5880 点击    2026-04-14 15:43
Harness,才是Agent时代统管一切的基座|交大综述解读Memory、Skills、Protocols

Harness,才是Agent时代统管一切的基座|交大综述解读Memory、Skills、Protocols

Harness,才是Agent时代统管一切的基座|交大综述解读Memory、Skills、Protocols

2026年再看Agent,一个越来越难回避的事实是:能力正在从模型里流到模型外。真正决定系统上限的,不再只是参数、Prompt和tool calling,而是记忆、技能、协议以及统摄这一切的harness。

来自主题: AI技术研报
9008 点击    2026-04-14 14:57
二元成功率已经过时!PRM-as-a-Judge才是你需要的具身操作评测框架

二元成功率已经过时!PRM-as-a-Judge才是你需要的具身操作评测框架

二元成功率已经过时!PRM-as-a-Judge才是你需要的具身操作评测框架

随着机器人操作从短程、单步技能逐步走向长程、富接触、需要持续协调与恢复能力的复杂任务,传统以二元成功率为核心的评测方式开始暴露出明显局限。它能够回答 “任务是否完成”,却难以回答 “策略推进到了哪里”“执行过程是否高效稳定”“失败究竟发生在什么阶段”。

来自主题: AI技术研报
8939 点击    2026-04-14 14:57
清华2年前预言,正成为全球共识!Meta等三大AI机构已得出同一结论

清华2年前预言,正成为全球共识!Meta等三大AI机构已得出同一结论

清华2年前预言,正成为全球共识!Meta等三大AI机构已得出同一结论

太疯狂了!Meta和METR刚测出的AI进化数据,与中国团队两年前提出的「密度定律」完美重合。硅谷猛然回头,发现中国研究者在这条路上已领先两年!

来自主题: AI技术研报
8583 点击    2026-04-14 09:11
OpenAI也开始恐惧自己训练出的新模型了

OpenAI也开始恐惧自己训练出的新模型了

OpenAI也开始恐惧自己训练出的新模型了

看到 Anthropic 内测中的下一代旗舰模型 Mythos 强大的网络攻防能力带来的巨大影响和讨论度,奥特曼坐不住了,也计划内测 OpenAI 具有强大的网络攻防能力的 AI。

来自主题: AI资讯
8721 点击    2026-04-14 09:11