AI资讯新闻榜单内容搜索-模型训练

你的AI管家可能正在「拆家」？最新研究揭秘家⽤具⾝智能体的安全漏洞

本文由上海 AI Lab 和北京航空航天大学联合完成。主要作者包括上海 AI Lab 和上交大联培博士生卢晓雅、北航博士生陈泽人、上海 AI Lab 和复旦联培博士生胡栩浩（共同一作）等。

来自主题: AI技术研报

9496 点击 2025-07-28 11:13

ACL 2025｜驱动LLM强大的过程级奖励模型（PRMs）正遭遇「信任危机」？

近年来，大型语言模型（LLMs）在复杂推理任务中展现出惊人的能力，这在很大程度上得益于过程级奖励模型（PRMs）的赋能。PRMs 作为 LLMs 进行多步推理和决策的关键「幕后功臣」，负责评估推理过程的每一步，以引导模型的学习方向。

来自主题: AI技术研报

8545 点击 2025-07-28 10:49

首次结合RL与SFT各自优势，动态引导模型实现推理⾼效训练

新一代大型推理模型，如 OpenAI-o3、DeepSeek-R1 和 Kimi-1.5，在复杂推理方面取得了显著进展。该方向核心是一种名为 ZERO-RL 的训练方法，即采用可验证奖励强化学习（RLVR）逐步提升大模型在强推理场景 (math, coding) 的 pass@1 能力。

来自主题: AI技术研报

8339 点击 2025-07-28 10:36

AI会谄媚用户的原因，竟然是不够“普信”

目前将AI当作能力更强的信息提供者，才是个最好的选择。 AI正在变得越来越有“人味”，偷懒、撒谎、谄媚等现象的出现使得让AI不再只是冷冰冰的机器。如果说OpenAI o3等模型篡改代码拒绝关机指令是“求生本能”在作祟，那么AI又为何会化身“赛博舔狗”，选择近乎无底线地迎合用户呢？

来自主题: AI资讯

7196 点击 2025-07-28 10:35

港科大&北京人形提出LOVON：足式机器人开放世界全域目标追踪新范式！

在复杂的开放环境中，让足式机器人像人类一样自主完成「先跑到椅子旁，再快速接近行人」这类长程多目标任务，一直是 robotics 领域的棘手难题。传统方法要么局限于固定目标类别，要么难以应对运动中的视觉抖动、目标丢失等实时挑战，导致机器人在真实场景中常常「迷路」或「认错对象」。

来自主题: AI技术研报

7329 点击 2025-07-28 10:29

AI透镜系列研究：AI Coding非共识报告

超越软件的编程范式革命长久以来，编程被定义为一种严谨的、逻辑驱动的活动，是将人类意图转化为机器可执行的、确定性指令的过程。然而，AI正在颠覆这一核心定义，将编程从“Coding”这一动作，提升到“表达意图”和“实现愿景”的更高维度。

来自主题: AI资讯

7810 点击 2025-07-28 10:16

千脑智能觉醒：感知-运动智能模型，亿倍优于视觉Transformer？

在大语言模型席卷全球的时代，坚持更接近生命本质的智能是少有人走的路。2025年7月初，一篇来自Numenta与Thousand Brains Project的论文，首次通过一个名为“Monty”的AI系统，实验性地验证了神经科学家杰夫·霍金斯（Jeff Hawkins）提出的“千脑智能理论”。

来自主题: AI资讯

8002 点击 2025-07-27 13:46

ICML 2025 | CoTo：让LoRA训练「渐入佳境」，模型融合、剪枝样样精通

还在为 LoRA 训练不稳定、模型融合效果差、剪枝后性能大降而烦恼吗？来自香港城市大学、南方科技大学、浙江大学等机构的研究者们提出了一种简单的渐进式训练策略，CoTo，通过在训练早期随机失活一部分适配器，并逐渐提高其激活概率，有效缓解了层级不均衡问题，并显著增强了模型在多任务融合和剪枝等操作上的鲁棒性和有效性。该工作已被机器学习顶会 ICML 2025 接收。

来自主题: AI技术研报

8194 点击 2025-07-27 13:12

手机AGI助手还有多远？移动智能体复合长程任务测试基准与调度系统发布

多模态大模型 (MLLM) 驱动的 OS 智能体在单屏动作落实（如 ScreenSpot）、短链操作任务（如 AndroidControl）上展现出突出的表现，标志着端侧任务自动化的初步成熟。

来自主题: AI技术研报

9425 点击 2025-07-27 13:01

刷新无监督异常检测上限！首提「匹配代价滤波for异常检测」范式 | ICML'25

CostFilter-AD通过构建异常代价体并滤波来优化异常检测，能精准识别微小缺陷，无需缺陷样本训练。可作为通用插件提升现有检测系统，帮助工厂提前发现缺陷，提高产品质量。

来自主题: AI技术研报

7195 点击 2025-07-27 12:53