AI资讯新闻榜单内容搜索-RL

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: RL
像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

让模型真正 “能行动”,往往需要一个可执行、可验证的符号世界模型(Symbolic World Model):它不是抽象的文字描述,而是能被规划器或执行器直接调用的形式化定义 —— 例如 PDDL 领域 / 问题,或可运行的环境代码 / 模拟器。

来自主题: AI技术研报
6811 点击    2026-02-03 09:11
国产模型开源封神,谷歌Genie3紧急开源?蚂蚁AGI撕开世界模型闭源防线

国产模型开源封神,谷歌Genie3紧急开源?蚂蚁AGI撕开世界模型闭源防线

国产模型开源封神,谷歌Genie3紧急开源?蚂蚁AGI撕开世界模型闭源防线

世界模型迎来高光时刻:谷歌还在闭源,中国团队已经把SOTA级世界模型全面开源了,LingBot-World正面硬刚Genie 3,彻底打破了全球垄断!

来自主题: AI资讯
7537 点击    2026-01-29 20:16
李飞飞世界模型公司一年估值暴涨5倍!正洽谈新一轮5亿美元融资

李飞飞世界模型公司一年估值暴涨5倍!正洽谈新一轮5亿美元融资

李飞飞世界模型公司一年估值暴涨5倍!正洽谈新一轮5亿美元融资

据彭博社消息:李飞飞创办的World Labs正在以约50亿美元估值进行新一轮融资,融资规模最高可达5亿美元。如果融资完成:World Labs的估值将从2024年的10亿美元,直接乘5到50亿美元。

来自主题: AI资讯
8073 点击    2026-01-25 16:05
AI人格集体黑化?Anthropic首次「赛博切脑」,物理斩断毁灭指令

AI人格集体黑化?Anthropic首次「赛博切脑」,物理斩断毁灭指令

AI人格集体黑化?Anthropic首次「赛博切脑」,物理斩断毁灭指令

不要被AI的温柔表象欺骗! Anthropic最新研究刺穿了AGI的温情假象:你以为在和良师益友倾诉,其实是在悬崖边给「杀手」松绑。 当脆弱情感遇上激活值坍塌,RLHF防御层将瞬间溃缩。既然无法教化野兽,人类只能选择最冷酷的「赛博脑叶切除术」。

来自主题: AI技术研报
7305 点击    2026-01-20 16:39
500万次围观,1X把「世界模型」真正用在了机器人NEO身上

500万次围观,1X把「世界模型」真正用在了机器人NEO身上

500万次围观,1X把「世界模型」真正用在了机器人NEO身上

还记得那个穿着「Lululemon」紧身衣、主打温柔陪伴的家用人形机器人 NEO 吗?

来自主题: AI技术研报
7549 点击    2026-01-14 15:35
闷声赚钱的 RL 生意:每个任务,200-20000 美元

闷声赚钱的 RL 生意:每个任务,200-20000 美元

闷声赚钱的 RL 生意:每个任务,200-20000 美元

2025 年 9 月,The Information 报道 Anthropic 曾讨论在接下来一年内投入超过 10 亿美元用于 RL 环境建设。Epoch AI 最近发了一篇报告,采访了 18 位来自 RL 环境初创公司、neolab(Cursor 这类应用型 AI 公司)和前沿实验室的从业者

来自主题: AI资讯
10007 点击    2026-01-14 11:37
华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

“软工任务要改多文件、多轮工具调用,模型怎么学透?高质量训练数据稀缺,又怕轨迹含噪声作弊?复杂 RL 训练成本高,中小团队望而却步?”

来自主题: AI技术研报
5785 点击    2026-01-13 16:36