AI资讯新闻榜单内容搜索-GE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GE
强化学习教父重出江湖, 生成式AI的时代要结束了?

强化学习教父重出江湖, 生成式AI的时代要结束了?

强化学习教父重出江湖, 生成式AI的时代要结束了?

过去两年,AI靠模仿人类席卷世界。但强化学习之父Richard Sutton却说:「GenAI的时代正在结束。」他带着图灵奖的荣光,加入一家几乎没人听过的公司——ExperienceFlow.AI,他要让AI不靠人类数据喂养,而靠「经验」觉醒。

来自主题: AI资讯
9304 点击    2025-11-07 15:04
在失败中进化?UIUC联合斯坦福、AMD实现智能体「从错误中成长」

在失败中进化?UIUC联合斯坦福、AMD实现智能体「从错误中成长」

在失败中进化?UIUC联合斯坦福、AMD实现智能体「从错误中成长」

伊利诺伊大学厄巴纳 - 香槟分校(UIUC)等团队近日发布论文,系统性剖析了 LLM 智能体失败的机制,并提出了可自我修复的创新框架 ——AgentDebug。该研究认为,AI 智能体应成为自身的观察者和调试者,不仅仅是被动的任务执行者,为未来大规模智能体的可靠运行和自动进化提供了理论与实践工具。

来自主题: AI技术研报
7858 点击    2025-11-07 15:01
NeurIPS 2025 Spotlight | 选择性知识蒸馏精准过滤:推测解码加速器AdaSPEC来了

NeurIPS 2025 Spotlight | 选择性知识蒸馏精准过滤:推测解码加速器AdaSPEC来了

NeurIPS 2025 Spotlight | 选择性知识蒸馏精准过滤:推测解码加速器AdaSPEC来了

目前,最先进的对齐方法是使用知识蒸馏(Knowledge Distillation, KD)在所有 token 上最小化 KL 散度。然而,最小化全局 KL 散度并不意味着 token 的接受率最大化。由于小模型容量受限,草稿模型往往难以完整吸收目标模型的知识,导致直接使用蒸馏方法的性能提升受限。在极限场景下,草稿模型和目标模型的巨大尺寸差异甚至可能导致训练不收敛。

来自主题: AI技术研报
8722 点击    2025-11-07 14:57
北大团队让AI学会考古!全球首个古希腊陶罐3D视觉问答数据集发布,还配了专用模型

北大团队让AI学会考古!全球首个古希腊陶罐3D视觉问答数据集发布,还配了专用模型

北大团队让AI学会考古!全球首个古希腊陶罐3D视觉问答数据集发布,还配了专用模型

现在AI都懂文物懂历史了。一项来自北京大学的最新研究引发关注:他们推出了全球首个面向古希腊陶罐的3D视觉问答数据集——VaseVQA-3D,并配套推出了专用视觉语言模型VaseVLM。这意味着,AI正在从“识图机器”迈向“文化考古Agent”。

来自主题: AI技术研报
8646 点击    2025-11-07 14:49
RLinf上新πRL:在线强化学习微调π0和π0.5

RLinf上新πRL:在线强化学习微调π0和π0.5

RLinf上新πRL:在线强化学习微调π0和π0.5

近年来,基于流匹配的 VLA 模型,特别是 Physical Intelligence 发布的 π0 和 π0.5,已经成为机器人领域备受关注的前沿技术路线。流匹配以极简方式建模多峰分布,能够生成高维且平滑的连续动作序列,在应对复杂操控任务时展现出显著优势。

来自主题: AI技术研报
11386 点击    2025-11-07 10:17
刚刚月之暗面发布Kimi K2 Thinking模型,藏师傅首测教你用 Kimi 编程全家桶

刚刚月之暗面发布Kimi K2 Thinking模型,藏师傅首测教你用 Kimi 编程全家桶

刚刚月之暗面发布Kimi K2 Thinking模型,藏师傅首测教你用 Kimi 编程全家桶

四个月前 Kimi 发布了 K2 模型,凭借优秀的质量以及先进的架构优化,一举打破了持续了几个月关于月之暗面的质疑。 我当时也写了两篇测评《Kimi K2 详测|超强代码和Agent 能力!内附Cla

来自主题: AI产品测评
13720 点击    2025-11-07 08:09
喝点VC|a16z对话Replit创始人:最后要抽象掉的就是代码本身;语法对人类来说是反直觉的。所以最终英语才是编程语言

喝点VC|a16z对话Replit创始人:最后要抽象掉的就是代码本身;语法对人类来说是反直觉的。所以最终英语才是编程语言

喝点VC|a16z对话Replit创始人:最后要抽象掉的就是代码本身;语法对人类来说是反直觉的。所以最终英语才是编程语言

“用户”这个身份从人类转移到了Agent本身。换句话说,现在真正写代码的“程序员”,已经不再是人类,而是AI。

来自主题: AI资讯
10690 点击    2025-11-06 14:58
英国首例AI训练判决!Stability AI大战Getty Images,双方均宣称胜诉

英国首例AI训练判决!Stability AI大战Getty Images,双方均宣称胜诉

英国首例AI训练判决!Stability AI大战Getty Images,双方均宣称胜诉

2025年11月4日,一家总部位于英国伦敦的人工智能公司Stability AI,赢得了一项具有里程碑意义的高等法院案件,该案审查了人工智能模型在未经许可的情况下使用大量受版权保护数据的合法性。而本案的原告,Getty Images 在针对人工智能公司 Stability AI 图像生成产品的英国诉讼中基本败诉。

来自主题: AI监管政策
9726 点击    2025-11-06 11:38