AI资讯新闻榜单内容搜索-模型训练

CoRL 2025｜隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力

在机器人操作任务中，预测性策略近年来在具身人工智能领域引起了广泛关注，因为它能够利用预测状态来提升机器人的操作性能。然而，让世界模型预测机器人与物体交互的精确未来状态仍然是一个公认的挑战，尤其是生成高质量的像素级表示。

来自主题: AI技术研报

6104 点击 2025-08-18 11:53

一句话概括，还在嫌弃RAG太慢？这帮研究员直接把检索数据库"蒸馏"成了一个小模型，实现了不检索的检索增强，堪称懒人福音。

来自主题: AI技术研报

6029 点击 2025-08-18 11:48

GPT-5是一个分水岭，终于学会了「推理」。联创Greg Brockman最新访谈畅谈了OpenAI AGI之路，未来AI可以做到边用边学，在超临界模式下推导出N阶后果。

来自主题: AI资讯

5564 点击 2025-08-18 11:26

自GPT-2以来，大模型的整体架构虽然未有大的变化，但从未停止演化的脚步。借OpenAI开源gpt-oss（120B/20B），Sebastian Raschka博士将我们带回硬核拆机现场，回溯了从GPT-2到gpt-oss的大模型演进之路，并将gpt-oss与Qwen3进行了详细对比。

来自主题: AI技术研报

6598 点击 2025-08-18 11:13

当前计算机使用智能体（CUA）的发展，主要依赖于大量昂贵的人工标注数据。这极大地限制了它们在缺少现成数据的新颖或专业软件中的应用能力。为了打破这一瓶颈，来自上海交通大学和香港中文大学的学者们提出了 SEAgent，一个全新的、无需任何人类干预，即可通过与环境交互来自主学习和进化的智能体框架。

来自主题: AI技术研报

6392 点击 2025-08-18 10:58

Genie 3来了！这或许是最接近「模拟世界」的AI魔法。只需一句话，它就能生成一个动态、可互动的世界——角色能互动、下水会溅起水花，甚至还能记住一分钟前的细节。DeepMind研究者直言：Genie 3是通向AGI的关键一步。

来自主题: AI资讯

6169 点击 2025-08-18 10:54

本项工作提出了一种全新的生成模型：离散分布网络（Discrete Distribution Networks），简称 DDN。相关论文已发表于 ICLR 2025。

来自主题: AI技术研报

6168 点击 2025-08-17 13:35

大语言模型（LLM）正从工具进化为“裁判”（LLM-as-a-judge），开始大规模地评判由AI自己生成的内容。这种高效的评估范式，其可靠性与人类判断的一致性，却很少被深入验证。

来自主题: AI技术研报

5779 点击 2025-08-17 13:16

近年来，AI大模型在数学计算、逻辑推理和代码生成领域的推理能力取得了显著突破。特别是DeepSeek-R1等先进模型的出现，可验证强化学习（RLVR）技术展现出强大的性能提升潜力。

来自主题: AI技术研报

5619 点击 2025-08-16 16:45

情绪价值这块儿，GPT-5让很多网友大呼失望。免费用户想念GPT-4o，也只能默默调理了。

来自主题: AI资讯

5541 点击 2025-08-16 16:17