AI资讯新闻榜单内容搜索-训练

不换GPU，性能飙升2.8倍！英伟达用软件暴打摩尔定律

MoE模型的稀疏激活本是优势，却常陷通信瓶颈。NVIDIA以软件为利剑，通过程序化依赖启动和全对全通信革新，在三个月内将GB200的单GPU吞吐提升2.8倍，真正释放Blackwell硬件潜力。

来自主题: AI技术研报

9624 点击 2026-04-28 10:09

AI「看不懂」、「做不好」视频的问题，混元用「MTSS」解决了

腾讯混元团队提出了 Multi-Stream Scene Script（MTSS），一种全新的视频描述范式 —— 将传统的 "一段话描述整个视频" 升级为 "多流结构化剧本"，通过 Stream Factorization 和 Relational Grounding 两大核心原则，让视频描述既忠实又可扩展，在视频理解和生成任务中均取得显著提升。

来自主题: AI技术研报

6989 点击 2026-04-28 09:57

超越Claude Mythos和GPT-5.5！斯坦福Agent验证框架拿下SOTA，Transformer作者转发

Transformer论文作者Lukasz Kaiser以及GAN作者Bing Xu转发关注了一项工作——LLM-as-a-Verifier验证框架，该方法是一种通用的验证机制，可与任意Agent Harness和模型结合。

来自主题: AI技术研报

9255 点击 2026-04-27 15:18

终于，学界找到了深度学习的「牛顿定律」

最近，由来自 UC Berkeley、哈佛、斯坦福等名校的 14 名研究者组成的研究团队发表了一篇论文，系统性地梳理了过去十年间散落在各处的理论碎片，并将它们拼成了一幅完整的图景。他们给这个正在形成的理论体系起了一个名字 ——Learning Mechanics（学习力学）。

来自主题: AI技术研报

8404 点击 2026-04-27 10:00

ACL 2026 | 别轻易给AI发「～」，它可能会删掉你的整个主目录

本文第一作者降伟鹏，西安交通大学在读博士生，主要研究方向为大模型安全与自动化测评。共同第一作者张笑宇，南洋理工大学博士后研究员，研究方向为软件工程、大模型安全与人机交互。通讯作者沈超，西安交通大学二级

来自主题: AI技术研报

6019 点击 2026-04-27 09:55

大模型高效推理新答案：ICLR 2026提出Balanced Thinking，精度提升10.0的同时，推理长度直降35.4%

哈尔滨工业大学（深圳）等机构的研究者提出了 ReBalance 方法，并首次系统性引入 Balanced Thinking 这一新视角。该工作的核心观点明确：高效推理的关键并非盲目压缩推理长度，而是在过度思考与思考不足之间维持动态平衡。

来自主题: AI技术研报

8161 点击 2026-04-27 09:53

苹果新论文发出惊人一问：What do your logits know?

苹果近年来在 AI 底层技术层面的投入正在不断加码。恰在此时，苹果 AI 研究团队提交了一篇极具探讨价值的论文《你的 logits 知道些什么？（答案可能会让你惊讶！）》

来自主题: AI技术研报

9638 点击 2026-04-27 09:47

时薪 15 美元的新工种：把 iPhone 绑在脑门上，替 AI 蒸馏自己

你或许刷到了一段来自印度南部服装厂的视频。工厂工人佩戴头戴摄像头，记录手部动作以训练人工智能系统。这是因为随着特斯拉、Figure AI 等公司竞相开发人形机器人，训练它们所需的真实世界动作数据变

来自主题: AI资讯

9836 点击 2026-04-26 22:36

Skill也有语言虚拟机了！上交大开源SkVM，实现一次编写，处处高效

Skill确实好用，但架不住模型和Agent Harness适配翻车。不是所有模型都吃得动Skill，有的用上直接反向掉性能。为了解决这个问题，来自上海交大的IPADS研究团队提出了SkVM：面向Skill的语言虚拟机。

来自主题: AI技术研报

9431 点击 2026-04-26 14:23

清华副教授代季峰创立Naive.ai，获约3亿美元融资

近日，AI创业公司Naive.ai的融资消息引发广泛关注。据多家媒体报道，这家由清华大学电子工程系副教授代季峰创立的新公司，已完成约3亿美元融资，估值约8亿美元。投资方包括一线基金和科技巨头，具体机构暂未披露。公司专注于开源模型的后训练和AI Agent方向，核心团队包括前MiroMind成员及联合创始人朱锡洲。

来自主题: AI资讯

7699 点击 2026-04-26 12:10