AI资讯新闻榜单内容搜索-训练

扩展外部测试时Scaling Law，中关村学院新发现：轻量级验证器可解锁LLM推理最优选择

在大语言模型（LLM）席卷各类复杂任务的今天，“测试时扩展”（Test-Time Scaling，TTS）已成为提升模型推理能力的核心思路 —— 简单来说，就是在模型 “答题” 时分配更多的计算资源来让它表现更好。严格来说，Test-Time Scaling 分成两类：

来自主题: AI技术研报

8412 点击 2025-11-06 14:59

英国首例AI训练判决！Stability AI大战Getty Images，双方均宣称胜诉

2025年11月4日，一家总部位于英国伦敦的人工智能公司Stability AI，赢得了一项具有里程碑意义的高等法院案件，该案审查了人工智能模型在未经许可的情况下使用大量受版权保护数据的合法性。而本案的原告，Getty Images 在针对人工智能公司 Stability AI 图像生成产品的英国诉讼中基本败诉。

来自主题: AI监管政策

10796 点击 2025-11-06 11:38

大模型不擅长点鼠标？中科院团队打造AI专属交互界面，任务成功率提升67%

在日常使用电脑时，看着屏幕、点击鼠标是再自然不过的基本操作。但这种对人类明明很容易的操作方式，却成为 AI 的巨大挑战：它们视力差、动作慢、不擅长看也不擅长点。

来自主题: AI技术研报

6501 点击 2025-11-06 10:32

北大字节开源首个时空推理视频模型！思考过程全透明，性能超越GPT-4o

AI看视频也能划重点了！

来自主题: AI技术研报

11688 点击 2025-11-06 09:40

NeurIPS 2025 Spotlight | 你刷到的视频是真的么？用物理规律拆穿Sora谎言

随着生成式 AI（如 Sora）的发展，合成视频几乎可以以假乱真，带来了深度伪造与虚假信息传播的风险。现有检测方法多依赖表层伪影或数据驱动学习，难以在高质量生成视频中保持较好的泛化能力。其根本原因在于，这些方法大都未能充分利用自然视频所遵循的物理规律，挖掘自然视频的更本质的特征。

来自主题: AI技术研报

9855 点击 2025-11-06 09:39

多智能体系统中，如何用向量数据库共享上下文？OpenAgents x Milvus

静态编排 VS 动态编排，谁是多agent系统最优解？通常来说，面对简单问题，采用react模式的单一agent就能搞定。可遇到复杂问题，单一agent就会立刻出现包括但不限于以下问题：串行执行效率低：无法同时完成并行的子步骤（如 “同时爬取 A、B 两个网站的数据”）。

来自主题: AI技术研报

9169 点击 2025-11-06 09:33

数字生命「培养皿」里，AI竟然学会了打架、结盟、抢地盘

一直以来，关于人工生命（Artificial Life, ALife）的研究致力于回答这样一个问题：生命的复杂性能否在计算系统中自然涌现？

来自主题: AI技术研报

8058 点击 2025-11-05 17:22

具身智能一步踏入Scaling Law！10B+基础模型，27万小时真实数据

当前机器人领域，基础模型主要基于「视觉-语言预训练」，这样可将现有大型多模态模型的语义泛化优势迁移过来。但是，机器人的智能确实能随着算力和数据的增加而持续提升吗？我们能预测这种提升吗？

来自主题: AI技术研报

7874 点击 2025-11-05 16:42

扩散不死，BERT永生！Karpathy凌晨反思：自回归时代该终结了?

谷歌遗珠与IBM预言：一文点醒Karpathy，扩散模型或成LLM下一步。

来自主题: AI技术研报

10705 点击 2025-11-05 16:41

清北联合推出Motion Transfer，比肩Gemini Robotics，让机器人直接从人类数据中端到端学习技能

近期，Google DeepMind 发布新一代具身大模型 Gemini Robotics 1.5，其核心亮点之一便是被称为 Motion Transfer Mechanism（MT）的端到端动作迁移算法 —— 无需重新训练，即可把不同形态机器人的技能「搬」到自己身上。不过，官方技术报告对此仅一笔带过，细节成谜。

来自主题: AI技术研报

9318 点击 2025-11-05 16:39