AI资讯新闻榜单内容搜索-AL

又一推理新范式：将LLM自身视作「改进操作符」，突破长思维链极限

Meta 超级智能实验室、伦敦大学学院、Mila、Anthropic 等机构的研究者进行了探索。从抽象层面来看，他们将 LLM 视为其「思维」的改进操作符，实现一系列可能的策略。研究者探究了一种推理方法家族 —— 并行 - 蒸馏 - 精炼（Parallel-Distill-Refine, PDR），

来自主题: AI技术研报

9911 点击 2025-10-10 10:33

奥特曼回应一切：ChatGPT不是美国版微信，Sora是为假视频时代「打预防针」|附万字采访

整场访谈中，Altman 展现出一种难得的坦诚。他承认 OpenAI 在某些测试上输给了竞争对手，承认提前发布 Sora 是为了让社会接受假视频的冲击，承认「AI slop」(AI 垃圾) 确实是个问题——但话锋一转，他补充道：人类自己也一直在制造烂活儿。

来自主题: AI资讯

9942 点击 2025-10-09 13:34

速递｜Perplexity收购红杉资本支持的，AI设计初创公司Visual Electric

红杉资本支持的AI 设计初创公司 Visual Electric 宣布，其团队今日将加入搜索初创企业 Perplexity。该公司在官网上表示，团队将并入 Perplexity 新成立的"智能体体验部门"。Perplexity 首席执行官 Aravind Srinivas 在 X 平台发文确认了此次收购。

来自主题: AI资讯

8471 点击 2025-10-09 12:30

开源RL框架Verlog来了，专为LLM智能体打造，400回合不成问题

具体而言，Verlog 是一个多轮强化学习框架，专为具有高度可变回合（episode）长度的长时程（long-horizon） LLM-Agent 任务而设计。它在继承 VeRL 和 BALROG 的基础上，并遵循 pytorch-a2c-ppo-acktr-gail 的成熟设计原则，引入了一系列专门优化手段，从而在任务跨度从短暂交互到数百回合时，依然能够实现稳定而高效的训练。

来自主题: AI技术研报

7603 点击 2025-10-09 11:16

速递｜19岁少年获谷歌AI掌门人投资，Supermemory用知识图谱为AI构建长期记忆

Supermemory 已获得由 Susa Ventures、Browder Capital 和 SF1.vc 领投的 260 万美元种子轮融资。此轮融资还包括 Cloudflare 的 Knecht、谷歌人工智能负责人 Jeff Dean、DeepMind 产品经理 Logan Kilpatrick、Sentry 创始人 David Cramer 以及来自 OpenAI、

来自主题: AI资讯

10142 点击 2025-10-08 12:27

从「知题」到「知人」：UserRL让智能体学会「以人为本」

来自 UIUC 与 Salesforce 的研究团队提出了一套系统化方案：UserBench —— 首次将 “用户特性” 制度化，构建交互评测环境，用于专门检验大模型是否真正 “懂人”；UserRL —— 在 UserBench 及其他标准化 Gym 环境之上，搭建统一的用户交互强化学习框架，并系统探索以用户为驱动的奖励建模。

来自主题: AI技术研报

9847 点击 2025-10-08 11:45

斯坦福华人研究火了：45分钟让你的论文变身AI智能体！

斯坦福大学研究人员提出了Paper2Agent，将静态论文转化为可交互的AI智能体，让学术成果可以直接被「调用」，为科研知识传播开辟了新模式，并为构建AI共研生态奠定基础。

来自主题: AI技术研报

10189 点击 2025-10-08 11:44

田渊栋与Russell团队联手，证明Transformer能在训练中自然学会叠加推理

该团队 2025 年的研究《Reasoning by superposition: A theoretical perspective on chain of continuous thought》已从理论上指出，连续思维链的一个关键优势在于它能使模型在叠加（superposition）状态下进行推理：当模型面对多个可能的推理路径而无法确定哪一个是正确时，它可以在连续空间中并行地保留所有可能的路

来自主题: AI技术研报

10069 点击 2025-10-08 11:41

多模态检索新突破，用软标签打破传统刚性映射约束，全面超越CLIP｜AAAI 2026 Oral

基于多模态大模型语义理解能力的统一多模态嵌入模型UniME-V2。该方法首先通过全局检索构建潜在困难负例集，随后创新性地引入“MLLM-as-a-Judge”机制：利用MLLM对查询-候选对进行语义对齐评估，生成软语义匹配分数。

来自主题: AI技术研报

6590 点击 2025-10-06 21:53

NeurIPS 2025 Spotlight | FSDrive统一VLA和世界模型，推动自动驾驶迈向视觉推理

面向自动驾驶的多模态大模型在 “推理链” 上多以文字或符号为中介，易造成空间 - 时间关系模糊与细粒度信息丢失。FSDrive（FutureSightDrive）提出 “时空视觉 CoT”（Spatio-Temporal Chain-of-Thought），让模型直接 “以图思考”，用统一的未来图像帧作为中间推理步骤，联合未来场景与感知结果进行可视化推理。

来自主题: AI技术研报

8814 点击 2025-10-06 13:42