AI资讯新闻榜单内容搜索-模型训练

GPT之父Alec Radford新作：给大模型做「脑部手术」，危险知识重学成本暴增7000倍

近日， Anthropic 和斯坦福研究者 Neil Rathi 与这位传奇研究者联合发布了一篇新论文，并得到了一些相当惊人的新发现。在这项研究中，他们挑战了当前大模型安全领域的一个核心假设。长期以来，业界普遍认为要在模型发布后通过 RLHF 或微调来限制其危险行为。但 Neil Rathi 和 Alec Radford 提出了一种更本质的解法：

来自主题: AI技术研报

9896 点击 2026-03-02 10:12

让搜索Agent不「傻等」：人大团队依托扩散模型实现「一心二用」，边等搜索结果边思考，加速15%性能不减

中国人民大学团队在论文DLLM-Searcher中，第一次让扩散大语言模型（dLLM）学会了这种“一心二用”的本事。目前主流的搜索Agent，不管是Search-R1还是R1Searcher，用的都是ReAct框架。这个框架的执行流程是严格串行的：

来自主题: AI技术研报

8897 点击 2026-03-02 10:00

支持远程操控和通用GUI操作，开源版桌面虚拟同事Open Cowork来了！

我们开源的 Open Cowork，正是一次面向 “桌面端虚拟同事” 的实践：一键安装、无需写代码，让模型在安全沙箱里操作你的工作空间，既能产出 PPT/Word/Excel/PDF 等专业成果，也能通过 GUI 直接操作电脑完成更复杂更通用的跨应用流程。

来自主题: AI技术研报

9871 点击 2026-03-02 10:00

西湖大学破解Rectified Flow反演不稳定难题，实现零成本稳定增强｜ICLR'26

现有Rectified Flow（RF）模型在反演阶段面临的核心挑战，是逆向ODE对微小误差高度敏感，容易沿着数值不稳定方向偏离前向流形，导致轨迹发散、重建不一致、编辑不可控。为解决这一问题，团队提出PMI（Prox-Mean-Inversion），一种针对RF反演稳定性的轻量化修正机制。

来自主题: AI技术研报

9410 点击 2026-03-02 09:59

Claude Code之父首曝：「养蛊式」开发，质量碾压老架构师

你以为你在用AI编程？其实你只是在陪它聊天！Claude Code内部指南曝光，别再和它玩你问我答了，它比你想象中更懂怎么修Bug。

来自主题: AI资讯

8805 点击 2026-03-01 11:24

GRASP Lab | VPP-TC: 基于可行性理论的被动力矩安全控制框架

本篇文章被 ICRA 2026 接收并获得 IROS 2025 双料 Workshop 最佳论文，第一作者张子哲(site: zizhe.io)是宾夕法尼亚大学机器人学硕士生，同时在 GRASP 实验室担任科研助理，导师为 Nadia Figueroa 教授，研究兴趣涵盖机器学习，安全控制以及人机交互。

来自主题: AI技术研报

10109 点击 2026-03-01 11:18

第一次，多模态大模型学会边看边听，Meta新作性能暴涨113%

Meta联合多所高校发布首个可规模化自动生成第一视角音视频理解数据的引擎EgoAVU ，让多模态大模型首次真正「听懂世界」。

来自主题: AI技术研报

9393 点击 2026-02-28 15:26

ICLR 2026 | 把视频扩散模型压到4bit，还能接近满血效果？ QVGen让「超低比特视频生成量化」真正可用

香港科技大学 & 北航 & 商汤等提出了一个专门面向视频生成扩散模型的 QAT 范式 ——QVGen，在 3-bit / 4-bit 都能把质量拉回来，并且让 4-bit 首次接近全精度表现成为现实。该论文现已被 ICLR 高分接收：rebuttal 前 88666（top 1.4%），rebuttal 后 88886 （top 0.5%）。

来自主题: AI技术研报

9070 点击 2026-02-28 15:12

ICLR 2026 | CineTrans: 首个转场可控的多镜头视频生成模型，打破闭源技术壁垒

基于对注意力特性的观察，CineTrans 提出块对角掩码的通用机制，使视频生成模型能高效地自动化转场。为了进一步提升转场模型的效果和准确性，作者设计了详细的多镜头视频生产管线，并收集了一个高质量、多镜头数据集 Cine250K，大幅提升多镜头转场视频生成的效果。作为首个时间级可控的自动化转场模型，CineTrans 为这一领域的众多后续方法提供了关键技术。

来自主题: AI技术研报

9631 点击 2026-02-28 15:05

何恺明团队新作GeoPT，全新预训练范式用合成动力学让模型自学真实物理规律

GeoPT提出了一种全新的动力学提升预训练范式，通过合成动力学（Synthetic Dynamics）将静态几何“提升”到动态空间，让模型在无标签数据上通过学习粒子轨迹演化来获取物理直觉。

来自主题: AI技术研报

9959 点击 2026-02-28 14:58