AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
终于,学界找到了深度学习的「牛顿定律」

终于,学界找到了深度学习的「牛顿定律」

终于,学界找到了深度学习的「牛顿定律」

最近,由来自 UC Berkeley、哈佛、斯坦福等名校的 14 名研究者组成的研究团队发表了一篇论文,系统性地梳理了过去十年间散落在各处的理论碎片,并将它们拼成了一幅完整的图景。他们给这个正在形成的理论体系起了一个名字 ——Learning Mechanics(学习力学)。

来自主题: AI技术研报
7873 点击    2026-04-27 10:00
ACL 2026 | 别轻易给AI发「~」,它可能会删掉你的整个主目录

ACL 2026 | 别轻易给AI发「~」,它可能会删掉你的整个主目录

ACL 2026 | 别轻易给AI发「~」,它可能会删掉你的整个主目录

本文第一作者降伟鹏,西安交通大学在读博士生,主要研究方向为大模型安全与自动化测评。共同第一作者张笑宇,南洋理工大学博士后研究员,研究方向为软件工程、大模型安全与人机交互。通讯作者沈超,西安交通大学二级

来自主题: AI技术研报
5523 点击    2026-04-27 09:55
大模型高效推理新答案:ICLR 2026提出Balanced Thinking,精度提升10.0的同时,推理长度直降35.4%

大模型高效推理新答案:ICLR 2026提出Balanced Thinking,精度提升10.0的同时,推理长度直降35.4%

大模型高效推理新答案:ICLR 2026提出Balanced Thinking,精度提升10.0的同时,推理长度直降35.4%

哈尔滨工业大学(深圳)等机构的研究者提出了 ReBalance 方法,并首次系统性引入 Balanced Thinking 这一新视角。该工作的核心观点明确:高效推理的关键并非盲目压缩推理长度,而是在过度思考与思考不足之间维持动态平衡。

来自主题: AI技术研报
7629 点击    2026-04-27 09:53
苹果新论文发出惊人一问:What do your logits know?

苹果新论文发出惊人一问:What do your logits know?

苹果新论文发出惊人一问:What do your logits know?

苹果近年来在 AI 底层技术层面的投入正在不断加码。恰在此时,苹果 AI 研究团队提交了一篇极具探讨价值的论文《你的 logits 知道些什么?(答案可能会让你惊讶!)》

来自主题: AI技术研报
9230 点击    2026-04-27 09:47
时薪 15 美元的新工种:把 iPhone 绑在脑门上,替 AI 蒸馏自己

时薪 15 美元的新工种:把 iPhone 绑在脑门上,替 AI 蒸馏自己

时薪 15 美元的新工种:把 iPhone 绑在脑门上,替 AI 蒸馏自己

你或许刷到了一段来自印度南部服装厂的视频。 工厂工人佩戴头戴摄像头,记录手部动作以训练人工智能系统。 这是因为随着特斯拉、Figure AI 等公司竞相开发人形机器人,训练它们所需的真实世界动作数据变

来自主题: AI资讯
9269 点击    2026-04-26 22:36
Skill也有语言虚拟机了!上交大开源SkVM,实现一次编写,处处高效

Skill也有语言虚拟机了!上交大开源SkVM,实现一次编写,处处高效

Skill也有语言虚拟机了!上交大开源SkVM,实现一次编写,处处高效

Skill确实好用,但架不住模型和Agent Harness适配翻车。不是所有模型都吃得动Skill,有的用上直接反向掉性能。为了解决这个问题,来自上海交大的IPADS研究团队提出了SkVM:面向Skill的语言虚拟机。

来自主题: AI技术研报
8688 点击    2026-04-26 14:23
清华副教授代季峰创立Naive.ai,获约3亿美元融资

清华副教授代季峰创立Naive.ai,获约3亿美元融资

清华副教授代季峰创立Naive.ai,获约3亿美元融资

近日,AI创业公司Naive.ai的融资消息引发广泛关注。据多家媒体报道,这家由清华大学电子工程系副教授代季峰创立的新公司,已完成约3亿美元融资,估值约8亿美元。投资方包括一线基金和科技巨头,具体机构暂未披露。公司专注于开源模型的后训练和AI Agent方向,核心团队包括前MiroMind成员及联合创始人朱锡洲。

来自主题: AI资讯
5637 点击    2026-04-26 12:10
前馈式3D的终极路线图来了!五大核心战线,一文看清未来三维重建该往哪走

前馈式3D的终极路线图来了!五大核心战线,一文看清未来三维重建该往哪走

前馈式3D的终极路线图来了!五大核心战线,一文看清未来三维重建该往哪走

从单幅图像恢复三维结构,到多视图场景建模、动态 4D 重建,再到机器人、自动驾驶、SLAM 与视频生成,如何让模型在不依赖逐场景优化的前提下,直接、高效地理解并重建三维世界,正在成为 3D 视觉领域的

来自主题: AI技术研报
9140 点击    2026-04-26 12:09
谷歌Jeff Dean重磅论文:弹性大规模分布式预训练终于可行了

谷歌Jeff Dean重磅论文:弹性大规模分布式预训练终于可行了

谷歌Jeff Dean重磅论文:弹性大规模分布式预训练终于可行了

弹性 AI 预训练已经推进到了下一个前沿!没有意外:来自谷歌。据介绍,他们提出的 Decoupled DiLoCo 是一种革命性的分布式训练技术,能够利用全球各地的异构硬件进行训练,并且即使当硬件发生故障时,系统也不会停止运行!

来自主题: AI技术研报
8579 点击    2026-04-25 13:33
扒完 DeepSeek V4 报告,我翻出了这个隐藏彩蛋

扒完 DeepSeek V4 报告,我翻出了这个隐藏彩蛋

扒完 DeepSeek V4 报告,我翻出了这个隐藏彩蛋

今天上午,DeepSeek V4 发布,直接把这个大模型疯狂更新月推向了最高潮。不过在我翻看 V4 的技术报告的时候,在训练层面看到了一个被大部分人滑过去的名词:Muon 优化器。

来自主题: AI技术研报
8602 点击    2026-04-25 10:12