AI资讯新闻榜单内容搜索-RL

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: RL
训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD

训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD

训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD

以DeepSeek R1为代表的一系列基于强化学习(RLVR)微调的工作,显著提升了大语言模型的推理能力。但在这股浪潮背后,强化微调的代价却高得惊人。

来自主题: AI技术研报
9514 点击    2026-02-10 14:19
全新视角看世界模型:从视频生成迈向通用世界模拟器

全新视角看世界模型:从视频生成迈向通用世界模拟器

全新视角看世界模型:从视频生成迈向通用世界模拟器

近年来,视频生成(Video Generation)与世界模型(World Models)已跃升为人工智能领域最炙手可热的焦点。从 Sora 到可灵(Kling),视频生成模型在运动连续性、物体交互与部分物理先验上逐渐表现出更强的「世界一致性」,让人们开始认真讨论:能否把视频生成从「逼真短片」推进到可用于推理、规划与控制的「通用世界模拟器」。

来自主题: AI技术研报
9567 点击    2026-02-09 14:36
全球首家无人公司开业!OpenClaw 24小时不休,疯狂碾压打工人

全球首家无人公司开业!OpenClaw 24小时不休,疯狂碾压打工人

全球首家无人公司开业!OpenClaw 24小时不休,疯狂碾压打工人

27岁独立开发者靠它月入数万,前市场经理睡觉时它写邮件赚钱,柏林辍学生卖自定义技能赚12.7万美元——AI智能体的「iPhone时刻」已来,只是钱还没平均分。

来自主题: AI资讯
9429 点击    2026-02-08 20:22
Waymo联手DeepMind打造世界模型:基于Genie 3,让自动驾驶「脑补」罕见场景

Waymo联手DeepMind打造世界模型:基于Genie 3,让自动驾驶「脑补」罕见场景

Waymo联手DeepMind打造世界模型:基于Genie 3,让自动驾驶「脑补」罕见场景

刚刚,Alphabet 旗下的自动驾驶汽车公司 Waymo,推出了最新世界模型 Waymo World Model,其基于 DeepMind 的 Genie 3 构建,在大规模、超真实自动驾驶仿真方面树立了全新的行业标杆。

来自主题: AI资讯
9496 点击    2026-02-08 12:09
致敬Kimi K2:基于slime的全流程INT4量化感知RL训练

致敬Kimi K2:基于slime的全流程INT4量化感知RL训练

致敬Kimi K2:基于slime的全流程INT4量化感知RL训练

受 Kimi K2 团队启发,SGLang RL 团队成功落地了 INT4 量化感知训练(QAT) 流程方案。通过 “训练端伪量化 + 推理端真实量化(W4A16)” 的方案组合,我们实现了媲美 BF16 全精度训练的稳定性与训推一致性,

来自主题: AI技术研报
6952 点击    2026-02-04 16:32
像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

让模型真正 “能行动”,往往需要一个可执行、可验证的符号世界模型(Symbolic World Model):它不是抽象的文字描述,而是能被规划器或执行器直接调用的形式化定义 —— 例如 PDDL 领域 / 问题,或可运行的环境代码 / 模拟器。

来自主题: AI技术研报
7322 点击    2026-02-03 09:11
国产模型开源封神,谷歌Genie3紧急开源?蚂蚁AGI撕开世界模型闭源防线

国产模型开源封神,谷歌Genie3紧急开源?蚂蚁AGI撕开世界模型闭源防线

国产模型开源封神,谷歌Genie3紧急开源?蚂蚁AGI撕开世界模型闭源防线

世界模型迎来高光时刻:谷歌还在闭源,中国团队已经把SOTA级世界模型全面开源了,LingBot-World正面硬刚Genie 3,彻底打破了全球垄断!

来自主题: AI资讯
8026 点击    2026-01-29 20:16
李飞飞世界模型公司一年估值暴涨5倍!正洽谈新一轮5亿美元融资

李飞飞世界模型公司一年估值暴涨5倍!正洽谈新一轮5亿美元融资

李飞飞世界模型公司一年估值暴涨5倍!正洽谈新一轮5亿美元融资

据彭博社消息:李飞飞创办的World Labs正在以约50亿美元估值进行新一轮融资,融资规模最高可达5亿美元。如果融资完成:World Labs的估值将从2024年的10亿美元,直接乘5到50亿美元。

来自主题: AI资讯
8579 点击    2026-01-25 16:05
AI人格集体黑化?Anthropic首次「赛博切脑」,物理斩断毁灭指令

AI人格集体黑化?Anthropic首次「赛博切脑」,物理斩断毁灭指令

AI人格集体黑化?Anthropic首次「赛博切脑」,物理斩断毁灭指令

不要被AI的温柔表象欺骗! Anthropic最新研究刺穿了AGI的温情假象:你以为在和良师益友倾诉,其实是在悬崖边给「杀手」松绑。 当脆弱情感遇上激活值坍塌,RLHF防御层将瞬间溃缩。既然无法教化野兽,人类只能选择最冷酷的「赛博脑叶切除术」。

来自主题: AI技术研报
7706 点击    2026-01-20 16:39