AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
AI「看不懂」、「做不好」视频的问题,混元用「MTSS」解决了

AI「看不懂」、「做不好」视频的问题,混元用「MTSS」解决了

AI「看不懂」、「做不好」视频的问题,混元用「MTSS」解决了

腾讯混元团队提出了 Multi-Stream Scene Script(MTSS),一种全新的视频描述范式 —— 将传统的 "一段话描述整个视频" 升级为 "多流结构化剧本",通过 Stream Factorization 和 Relational Grounding 两大核心原则,让视频描述既忠实又可扩展,在视频理解和生成任务中均取得显著提升。

来自主题: AI技术研报
6432 点击    2026-04-28 09:57
超越Claude Mythos和GPT-5.5!斯坦福Agent验证框架拿下SOTA,Transformer作者转发

超越Claude Mythos和GPT-5.5!斯坦福Agent验证框架拿下SOTA,Transformer作者转发

超越Claude Mythos和GPT-5.5!斯坦福Agent验证框架拿下SOTA,Transformer作者转发

Transformer论文作者Lukasz Kaiser以及GAN作者Bing Xu转发关注了一项工作——LLM-as-a-Verifier验证框架,该方法是一种通用的验证机制,可与任意Agent Harness和模型结合。

来自主题: AI技术研报
8199 点击    2026-04-27 15:18
终于,学界找到了深度学习的「牛顿定律」

终于,学界找到了深度学习的「牛顿定律」

终于,学界找到了深度学习的「牛顿定律」

最近,由来自 UC Berkeley、哈佛、斯坦福等名校的 14 名研究者组成的研究团队发表了一篇论文,系统性地梳理了过去十年间散落在各处的理论碎片,并将它们拼成了一幅完整的图景。他们给这个正在形成的理论体系起了一个名字 ——Learning Mechanics(学习力学)。

来自主题: AI技术研报
7871 点击    2026-04-27 10:00
ACL 2026 | 别轻易给AI发「~」,它可能会删掉你的整个主目录

ACL 2026 | 别轻易给AI发「~」,它可能会删掉你的整个主目录

ACL 2026 | 别轻易给AI发「~」,它可能会删掉你的整个主目录

本文第一作者降伟鹏,西安交通大学在读博士生,主要研究方向为大模型安全与自动化测评。共同第一作者张笑宇,南洋理工大学博士后研究员,研究方向为软件工程、大模型安全与人机交互。通讯作者沈超,西安交通大学二级

来自主题: AI技术研报
5523 点击    2026-04-27 09:55
大模型高效推理新答案:ICLR 2026提出Balanced Thinking,精度提升10.0的同时,推理长度直降35.4%

大模型高效推理新答案:ICLR 2026提出Balanced Thinking,精度提升10.0的同时,推理长度直降35.4%

大模型高效推理新答案:ICLR 2026提出Balanced Thinking,精度提升10.0的同时,推理长度直降35.4%

哈尔滨工业大学(深圳)等机构的研究者提出了 ReBalance 方法,并首次系统性引入 Balanced Thinking 这一新视角。该工作的核心观点明确:高效推理的关键并非盲目压缩推理长度,而是在过度思考与思考不足之间维持动态平衡。

来自主题: AI技术研报
7628 点击    2026-04-27 09:53
苹果新论文发出惊人一问:What do your logits know?

苹果新论文发出惊人一问:What do your logits know?

苹果新论文发出惊人一问:What do your logits know?

苹果近年来在 AI 底层技术层面的投入正在不断加码。恰在此时,苹果 AI 研究团队提交了一篇极具探讨价值的论文《你的 logits 知道些什么?(答案可能会让你惊讶!)》

来自主题: AI技术研报
9226 点击    2026-04-27 09:47
Skill也有语言虚拟机了!上交大开源SkVM,实现一次编写,处处高效

Skill也有语言虚拟机了!上交大开源SkVM,实现一次编写,处处高效

Skill也有语言虚拟机了!上交大开源SkVM,实现一次编写,处处高效

Skill确实好用,但架不住模型和Agent Harness适配翻车。不是所有模型都吃得动Skill,有的用上直接反向掉性能。为了解决这个问题,来自上海交大的IPADS研究团队提出了SkVM:面向Skill的语言虚拟机。

来自主题: AI技术研报
8687 点击    2026-04-26 14:23
前馈式3D的终极路线图来了!五大核心战线,一文看清未来三维重建该往哪走

前馈式3D的终极路线图来了!五大核心战线,一文看清未来三维重建该往哪走

前馈式3D的终极路线图来了!五大核心战线,一文看清未来三维重建该往哪走

从单幅图像恢复三维结构,到多视图场景建模、动态 4D 重建,再到机器人、自动驾驶、SLAM 与视频生成,如何让模型在不依赖逐场景优化的前提下,直接、高效地理解并重建三维世界,正在成为 3D 视觉领域的

来自主题: AI技术研报
9139 点击    2026-04-26 12:09
谷歌Jeff Dean重磅论文:弹性大规模分布式预训练终于可行了

谷歌Jeff Dean重磅论文:弹性大规模分布式预训练终于可行了

谷歌Jeff Dean重磅论文:弹性大规模分布式预训练终于可行了

弹性 AI 预训练已经推进到了下一个前沿!没有意外:来自谷歌。据介绍,他们提出的 Decoupled DiLoCo 是一种革命性的分布式训练技术,能够利用全球各地的异构硬件进行训练,并且即使当硬件发生故障时,系统也不会停止运行!

来自主题: AI技术研报
8577 点击    2026-04-25 13:33
谷歌再发「香蕉」!何恺明等引爆视觉Transformer时刻

谷歌再发「香蕉」!何恺明等引爆视觉Transformer时刻

谷歌再发「香蕉」!何恺明等引爆视觉Transformer时刻

最近,谷歌联合ResNet作者何恺明、谢赛宁、NeRF先驱Jonathan T. Barron、 3D图形学名家Thomas Funkhouser,正式发布了Vision Banana。它向世界宣告:视觉AI终于不再需要那些臃肿的任务头了,理解,本质上只是生成过程中的一次「对齐」。

来自主题: AI技术研报
9048 点击    2026-04-24 16:13