AI资讯新闻榜单内容搜索-数据

从「会说」迈向「会做」，LLM下半场：Agentic强化学习范式综述

过去几年，大语言模型（LLM）的训练大多依赖于基于人类或数据偏好的强化学习（Preference-based Reinforcement Fine-tuning, PBRFT）：输入提示、输出文本、获得一个偏好分数。这一范式催生了 GPT-4、Llama-3 等成功的早期大模型，但局限也日益明显：缺乏长期规划、环境交互与持续学习能力。

来自主题: AI技术研报

9358 点击 2025-09-09 10:49

斯坦福：优化器「诸神之战」？AdamW 凭「稳定」胜出

自2014 年提出以来，Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位，帮助模型在海量数据下保持稳定并实现较快收敛。

来自主题: AI技术研报

8041 点击 2025-09-08 16:18

AI巨头陷版权风暴，免费的“数据盛宴”即将散场？

近日，备受关注的德里亚·巴茨（Andrea Bartz）等诉Anthropic公司的集体诉讼案以一项高达15亿美元的和解协议暂告段落。该案自立案之初便牵动科技界与版权界神经，其最终处理结果及创纪录的和解金额，在AI行业内引发强烈震动。

来自主题: AI资讯

10498 点击 2025-09-08 16:10

具身VLA后训练：TeleAI提出潜空间引导的VLA跨本体泛化方法

在多模态大模型的基座上，视觉 - 语言 - 动作（Visual-Language-Action, VLA）模型使用大量机器人操作数据进行预训练，有望实现通用的具身操作能力。

来自主题: AI技术研报

6991 点击 2025-09-08 15:20

16岁创业，22岁做成百亿独角兽！3位高中同学帮大厂训AI年入1亿美金

Meta豪掷143亿收购Scale AI，意外成就了3名22岁青年的创业神话！他们靠着为OpenAI等顶级AI实验室输送模型专家训练师，干出百亿独角兽Mercor，年入1亿美金。目前，Mercor在《福布斯》Cloud 100 榜单中排名第89位。

来自主题: AI资讯

6029 点击 2025-09-08 10:10

SceneSplat: 基于3DGS的场景理解和视觉语言预训练，让3D高斯「听懂人话」的一跃

开放词汇识别与分类对于全面理解现实世界的 3D 场景至关重要。目前，所有现有方法在训练或推理过程中都依赖于 2D 或文本模态。这凸显出缺乏能够单独处理 3D 数据以进行端到端语义学习的模型，以及训练此类模型所需的数据。与此同时，3DGS 已成为各种视觉任务中 3D 场景表达的重要标准之一。

来自主题: AI技术研报

6874 点击 2025-09-08 10:01

调整训练数据出场顺序，大模型就能变聪明！无需扩大模型/数据规模

模型训练重点在于数据的数量与质量？其实还有一个关键因素—— 数据的出场顺序。

来自主题: AI技术研报

7002 点击 2025-09-07 11:26

多模态大模型持续学习系列研究，综述+Benchmark+方法+Codebase一网打尽！

近年来，生成式 AI 和多模态大模型在各领域取得了令人瞩目的进展。然而，在现实世界应用中，动态环境下的数据分布和任务需求不断变化，大模型如何在此背景下实现持续学习成为了重要挑战

来自主题: AI技术研报

9079 点击 2025-09-06 11:50

告别海量标注！浙大团队提出GUI-RCPO，让GUI定位在无标签数据上自我进化

无需海量数据标注，智能体也能精确识别定位目标元素了！来自浙大等机构的研究人员提出GUI-RCPO——一种自我监督的强化学习方法，可以让模型在没有标注的数据上自主提升GUI grounding（图形界面定位）能力。

来自主题: AI技术研报

8699 点击 2025-09-05 15:28

哈佛研究报告：AI正在职场制造“新贫富差距”

9月3日消息，美国哈佛大学博士生赛义德·侯赛尼（Seyed M. Hosseini）与盖伊·莱廷格（Guy Lichtinger）近日发布研究报告，名为《生成式AI：一种偏向资历的技术变革》。该研究使用2015年第一季度至2025年第一季度美国近28.5万家企业、约6200万员工的简历和招聘数据，研究 “生成式AI采用如何影响不同资历员工的就业情况”。

来自主题: AI技术研报

8251 点击 2025-09-05 12:03