AI资讯新闻榜单内容搜索-训练

清华、NVIDIA、斯坦福提出DiffusionNFT：基于前向过程的扩散强化学习新范式，训练效率提升25倍

清华大学朱军教授团队，NVIDIA Deep Imagination 研究组与斯坦福 Stefano Ermon 团队联合提出了一种全新的扩散模型强化学习（RL）范式 ——Diffusion Negative-aware FineTuning (DiffusionNFT)。该方法首次突破现有 RL 对扩散模型的基本假设，直接在前向加噪过程（forward process）上进行优化

来自主题: AI技术研报

10959 点击 2025-10-08 11:43

田渊栋与Russell团队联手，证明Transformer能在训练中自然学会叠加推理

该团队 2025 年的研究《Reasoning by superposition: A theoretical perspective on chain of continuous thought》已从理论上指出，连续思维链的一个关键优势在于它能使模型在叠加（superposition）状态下进行推理：当模型面对多个可能的推理路径而无法确定哪一个是正确时，它可以在连续空间中并行地保留所有可能的路

来自主题: AI技术研报

10116 点击 2025-10-08 11:41

苹果再发论文：精准定位LLM幻觉，GPT-5、o3都办不到

论文提出的方法名为 RL4HS，它使用了片段级奖励（span-level rewards）和类别感知的 GRPO（Class-Aware Group Relative Policy Optimization），从而避免模型偷懒、只输出无错误预测。

来自主题: AI资讯

10036 点击 2025-10-07 22:11

EMNLP 2025 | CARE：无需外部工具，让大模型原生检索增强推理实现上下文高保真

近日，来自 MetaGPT、蒙特利尔大学和 Mila 研究所、麦吉尔大学、耶鲁大学等机构的研究团队发布 CARE 框架，一个新颖的原生检索增强推理框架，教会 LLM 将推理过程中的上下文事实与模型自身的检索能力有机结合起来。该框架现已全面开源，包括训练数据集、训练代码、模型 checkpoints 和评估代码，为社区提供一套完整的、可复现工作。

来自主题: AI技术研报

8719 点击 2025-10-07 22:10

Meta FAIR田渊栋唯一作者发文：拆解模型「顿悟时刻」

早在 2021 年，研究人员就已经发现了深度神经网络常常表现出一种令人困惑的现象，模型在早期训练阶段对训练数据的记忆能力较弱，但随着持续训练，在某一个时间点，会突然从记忆转向强泛化。

来自主题: AI技术研报

9825 点击 2025-10-07 22:06

多模态检索新突破，用软标签打破传统刚性映射约束，全面超越CLIP｜AAAI 2026 Oral

基于多模态大模型语义理解能力的统一多模态嵌入模型UniME-V2。该方法首先通过全局检索构建潜在困难负例集，随后创新性地引入“MLLM-as-a-Judge”机制：利用MLLM对查询-候选对进行语义对齐评估，生成软语义匹配分数。

来自主题: AI技术研报

6646 点击 2025-10-06 21:53

AI花17小时写了篇30页学术论文！自主选题，包含实验，还符合APA格式规范

不是拼凑知识点，AI这次是真搞研究。一个叫Virtuous Machines的AI系统，花了17小时、114美元，找了288个真人做实验，写了一篇30页的学术论文。而且还是从选题到成稿全自动化速通！？

来自主题: AI技术研报

10892 点击 2025-10-06 19:53

CAIR开源发布超声基座大模型EchoCare“聆音”，10余项医学任务性能登顶

2025年9月17日，中国科学院香港创新研究院人工智能与机器人创新中心（CAIR）在香港正式开源发布其最新科研成果——EchoCare“聆音”超声基座大模型（简称“聆音”）。该模型基于超过450万张、涵盖50多个人体器官的大规模超声影像数据集训练而成，在器官识别、器官分割、病灶分类等10余项典型超声医学任务测试中表现卓越，性能全面登顶。

来自主题: AI技术研报

9676 点击 2025-10-06 15:53

Insta360最新全景综述：全景视觉的挑战、方法与未来

本文作者团队来自 Insta360 影石研究院及其合作高校。目前，Insta360 正在面向世界模型、多模态大模型、生成式模型等前沿方向招聘实习生与全职算法工程师，欢迎有志于前沿 AI 研究与落地的同

来自主题: AI技术研报

8080 点击 2025-10-06 14:46

重生之在《我的世界》做山姆·奥特曼：网友在线手搓ChatGPT

逆天，太逆天。一老哥在《我的世界》上手搓了一个ChatGPT！这你敢信？这款手搓GPT不仅经过英语对话训练，有500万个参数，还能在像素世界里的小电脑上跟你对话。

来自主题: AI资讯

10748 点击 2025-10-06 14:04