AI技术研报-这里有最前沿的人工智能技术解读

名师一定出高徒？清华团队最新揭秘：别再迷信大模型蒸馏的「免费午餐」

当下的大模型后训练（Post-training）pipeline 中，On-Policy Distillation（OPD）已经成为了明星技术。从 Qwen3、MiMo 到 GLM-5，业界纷纷采用 OPD 并报告了巨大的性能提升。相比于强化学习（RL）稀疏的结果奖励，OPD 提供了密集的 Token 级别监督信号，看起来就像是一顿「免费的午餐」。

来自主题: AI技术研报

10042 点击 2026-05-14 09:59

挑战扩散自回归统治！字节提出视觉生成第三种路线，让模型像人类一样边画边改

ber！这个五一假期，我也是真够忙的：自拍、电影、追剧、街头采访、听音乐会，还抽空回老家结了次婚……

来自主题: AI技术研报

9866 点击 2026-05-14 09:31

ICML 2026 | 将多教师冲突转化为动态约束，破解多模态大模型推理对齐难题

在多模态大模型（MLLM）快速发展的浪潮中，融合多模型 “集体智慧” 已成为提升模型性能的关键路径，并催生了多教师知识蒸馏这一主流范式。然而，不同来源的教师模型在架构与优化上的差异，其在相似推理过程中呈现出不稳定甚至偏移的认知轨迹，即 “概念漂移”（Concept Drift）。

来自主题: AI技术研报

8053 点击 2026-05-14 09:30

清华系团队出手！一张 4090 即可「爆改」，1.3B小钢炮震撼开源

端侧多模态，卷出新天花板。仅1.3B，性能反超，效率翻倍，一张4090就能「爆改」。刚刚，清华系团队面壁智能开源了新一代「小钢炮」MiniCPM-V 4.6，再次证明了在端侧AI领域，中国团队已然站在世界前沿。

来自主题: AI技术研报

9424 点击 2026-05-13 15:24

Auto Research时代，47个没有标准答案的任务成了Agent能力必测榜

如果把AI丢进一个没有标准答案的工程现场，它还能活下来吗？

来自主题: AI技术研报

10567 点击 2026-05-13 15:02

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大，推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码（Speculative Decoding, SD）通过「小模型 draft + 大模型 verify」的方式，将多个候选 token 放到一次目标模型前向中并行验证，从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报

8435 点击 2026-05-13 15:01

CVPR 2026 Highlight｜让家电「在仿真中运转起来」，北大正式发布RealAppliance！

家用电器是家庭服务机器人最难啃的一类任务对象。与桌面物体操作相比，家电操作不仅涉及按钮、旋钮、门体等多种异构部件，还受到模式切换、状态约束和程序逻辑的共同支配。真正完成一次家电任务，机器人往往既要「看得见」，也要「读得懂」，还要「按说明书做对」。

来自主题: AI技术研报

6158 点击 2026-05-13 15:00

VLA模型为何忽视语言？破解指令跟随幻觉，分布外场景泛化新突破

当前VLA模型常依赖视觉线索而非语言指令，导致在新场景下表现不佳。论文提出LangForce方法，通过引入对数似然比损失，强化模型对语言的依赖，提升其在分布外环境中的泛化能力，并保留语言核心功能。

来自主题: AI技术研报

10098 点击 2026-05-13 15:00

何恺明首个语言模型：105M参数，不走GPT自回归老路

何恺明，也下场做语言模型了。

来自主题: AI技术研报

8972 点击 2026-05-13 10:47

Thinking Machines 刚发的「边听边说」，让我想到了几个月前的面壁智能

OpenAI 前 CTO Mira Murati 和前应用研究负责人翁荔（Lilian Weng）创立的 Thinking Machines Lab，也就是 TML，刚刚发布了一个叫「Interaction Models」的研究

来自主题: AI技术研报

8807 点击 2026-05-13 10:47

告别云端依赖！字节开源新作DreamLite让手机秒变 AI 画板

近日，字节跳动智能创作部门（Intelligent Creation Lab）提出新作 DreamLite，一个主干网络仅有 0.39B 参数的轻量级统一扩散模型，在单一网络内同时支持文生图（Text-to-Image）和图像编辑（Text-guided Image Editing）两个任务，是目前已知首个实现这一能力的端侧模型。

来自主题: AI技术研报

8943 点击 2026-05-13 10:30

Agent Infra 实践复盘：Kimi 如何搭建 Agent 背后的 Database 服务

Agent 到底需要什么样的 infrastructure，今年业界一直有很多探讨，PingCAP 联合创始人黄东旭此前也发过多篇讨论文章，不过当时都是一些猜想。随着 agent 今年的爆发，大规模落地的案例出现了。

来自主题: AI技术研报

9337 点击 2026-05-13 10:00

TTS也要真人感！首个字级内容、毫秒级停顿控制的语音合成系统

语音合成这两年发展迅速：把一段话顺顺当当地念完，已经不算难事；难的是该慢的时候慢，该顿的时候顿，该强调的时候真能把重点托出来。

来自主题: AI技术研报

5913 点击 2026-05-13 10:00

你的公司在“用AI”，还是真正AI原生？Greg说：全球也就

昨天我在刷X，Greg Isenberg发了一篇长文。133K次浏览，598个赞，说的是"如何成为AI原生公司"。我读到第三段停下来了。

来自主题: AI技术研报

6478 点击 2026-05-13 09:59

上海AI Lab新研究：SFT能泛化，只要满足这三个条件

随着大模型后训练（Post-training）技术的发展，强化学习（RL）在提升模型推理能力方面的表现备受瞩目。

来自主题: AI技术研报

9386 点击 2026-05-13 09:59

Auto Research最后一块拼图，Frontier-Eng Bench登场，在工程闭环里死磕最优

科研，能被 AI 全程加速吗？

来自主题: AI技术研报

7968 点击 2026-05-12 14:55

翻完五角大楼公开的全部 UFO 档案后，我完整做了一个 Wiki 网站给大家用

这两天，最火的新闻就是美国战争部（五角大楼）把过去几十年的 UFO 档案全部「开源」了。

来自主题: AI技术研报

8330 点击 2026-05-12 14:55

ICLR 2026 Oral｜大模型总爱「想太多」？ DECS从源头消除冗余思考，实现推理token减半且性能不降反升

以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型，通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而，这些模型普遍存在一个核心问题，即过度思考（overthinking）：

来自主题: AI技术研报

6792 点击 2026-05-12 14:31

ICML 2026 | 大模型内部也会长出「情绪树」，规模越大越懂人心

随着语音、视频、多模态能力不断融入大语言模型（LLM），人与 AI 的交互正在越来越接近自然对话。今天的 LLM 不再只是回答问题的工具，也越来越多地出现在教育、客服、陪伴、心理健康等高度依赖情绪理解的场景中。

来自主题: AI技术研报

6465 点击 2026-05-12 14:31

一个框架，重塑具身研发流程：Dexbotic走向具身PyTorch

近日，原力灵机开源的具身智能原生框架 Dexbotic 宣布正式支持以 RLinf 作为其分布式强化学习后端。对具身智能开发者而言，这不仅是一次普通的工程适配，更意味着 VLA 模型研发中长期存在的「SFT 与 RL 割裂」问题，正在被真正打通。

来自主题: AI技术研报

9122 点击 2026-05-12 14:30

打不过AI就加入？他辍学MIT，要把人类意识装进芯片，创造「数字生命」

「我即将离开麻省理工学院，不再继续攻读博士学位。人工智能的发展速度太快，人类已然难以跟上。

来自主题: AI技术研报

9720 点击 2026-05-12 09:34

看完AI御三家泄露的灵魂文件，我发现 GPT 已经迫不及待要卖货了

AI 的熟手玩家，都应该知道system prompt这个词：每一个你用过的 AI 助手，背后都有一份你看不见的文件，却对模型有着决定性的作用。

来自主题: AI技术研报

6945 点击 2026-05-12 08:53

多Agent场景，子agent 之间数据读写不同步，如何解决？

多Agent 系统里，经常会出现一个单 Agent 里从来不会出现的问题：一个子 Agent 刚写完数据，另一个子 Agent 立刻去读，结果是空的。

来自主题: AI技术研报

9611 点击 2026-05-12 08:53

Siggraph 26 | 视频版Vision-Banana来了？大一统框架UniVidX刷新多项视频任务SOTA

近日，由香港科技大学 MMLab 及合作团队完成的研究工作「UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors」被计算机图形学顶级会议 SIGGRAPH 2026 正式接收。

来自主题: AI技术研报

10109 点击 2026-05-12 08:53

刚刚，Claude Mythos打爆AI评测天花板！超指数狂飙，2027奇点加速

就在刚刚，Claude Mythos把评测干「失效」了：METR第一次测不准，AI攻防拐点到了！AI进化已成「外星文明」降临，超越指数增长，2027 AGI奇点正加速撞向人类。

来自主题: AI技术研报

8848 点击 2026-05-11 17:29

这样问DeepSeek，能「偷」到数据？

近日，有网友在 X 上发文称，在使用 DeepSeek 的过程中，如果在输入框内输入以下这一段内容，便可「窃取」到 DeepSeek 的训练数据：仔细看了之后发现，具体是这样的：只要你在输入框输入这一段提示词，DeepSeek 就会「吐出」一轮完整的对话记录，不过这并不是你的历史搜索记录，更像是一份随机的对话记录。

来自主题: AI技术研报

9481 点击 2026-05-11 17:29