AI资讯新闻榜单内容搜索-NeurIPS

多模态大模型首次实现像素级推理！3B参数超越72B传统模型，NeurIPS 2025收录

多模态大模型首次实现像素级推理，指代、分割、推理三大任务一网打尽！

来自主题: AI技术研报

10137 点击 2025-10-17 10:01

基础模型已颠覆科研，进入第五范式！港科大综述113篇论文 | NeurIPS'25

基础模型（FM）是一种在海量数据上训练的人工智能系统，具备强大的通用性和跨模态能力。港科大最新发表的论文显示：FM可能引领科学进入第五范式，但大模型的偏见、幻觉等问题仍需正视。

来自主题: AI技术研报

8371 点击 2025-10-16 15:01

NeurIPS 2025 Spotlight | 条件表征学习：一步对齐表征与准则

一张图片包含的信息是多维的。例如下面的图 1，我们至少可以得到三个层面的信息：主体是大象，数量有两头，环境是热带稀树草原（savanna）。然而，如果由传统的表征学习方法来处理这张图片，比方说就将其送入一个在 ImageNet 上训练好的 ResNet 或者 Vision Transformer，往往得到的表征只会体现其主体信息，也就是会简单地将该图片归为大象这一类别。这显然是不合理的。

来自主题: AI技术研报

8258 点击 2025-10-16 14:43

NeurIPS 25 | 中大&UC Merced等开源RAPID Hand，重新定义多指灵巧手数据采集

在最近的一篇 NeurIPS 25 中稿论文中，来自中山大学、加州大学 Merced 分校、中科院自动化研究所、诚橙动力的研究者联合提出了一个全新开源的高自由度灵巧手平台 — RAPID Hand (Robust, Affordable, Perception-Integrated, Dexterous Hand)。

来自主题: AI技术研报

10297 点击 2025-10-16 10:52

告别「解码器饥饿」！中国科学院NeurIPS推SpaceServe，高并发克星

在中国科学院计算技术研究所入选NeurIPS 2025的新论文中，提出了SpaceServe的突破性架构，首次将LLM推理中的P/D分离扩展至多模态场景，通过EPD三阶解耦与「空分复用」，系统性地解决了MLLM推理中的行头阻塞难题。

来自主题: AI技术研报

9268 点击 2025-10-13 16:08

NeurIPS 2025 Spotlight | GeoSVR：稀疏体素的新潜力——超越3DGS系列的高精度三维表面重建

近年来，NeRF、SDF 与 3D Gaussian Splatting 等方法大放异彩，让 AI 能从图像中恢复出三维世界。但随着相关技术路线的发展与完善，瓶颈问题也随之浮现：

来自主题: AI技术研报

8688 点击 2025-10-13 15:38

NeurIPS 2025 Spotlight | PhysX-3D：面向真实物理世界的3D资产生成范式

3D 生成正从纯虚拟走向物理真实，现有的 3D 生成方法主要侧重于几何结构与纹理信息，而忽略了基于物理属性的建模。

来自主题: AI技术研报

9473 点击 2025-10-13 11:42

清华大学x生数科技：从波形到隐空间，AudioLBM引领音频超分新范式

在这一背景下，清华大学与生数科技（Shengshu AI）团队围绕桥类生成模型与音频超分任务展开系统研究，先后在语音领域顶级会议ICASSP 2025和机器学习顶级会议NeurIPS 2025发表了两项连续成果：

来自主题: AI技术研报

9920 点击 2025-10-13 10:30

RL 将如何提高具身大模型 VLA 泛化性？清华大学团队NeurIPS 2025文章分析 RL 与 SFT 泛化性差异

在具身智能领域，视觉 - 语言 - 动作（VLA）大模型正展现出巨大潜力，但仍面临一个关键挑战：当前主流的有监督微调（SFT）训练方式，往往让模型在遇到新环境或任务时容易出错，难以真正做到类人般的泛化

来自主题: AI技术研报

10339 点击 2025-10-13 10:28

NeurIPS 2025 Spotlight | 只需一条演示，DexFlyWheel框架让机器人学会「自我造数据」

近期，北京大学、哈尔滨工业大学联合 PsiBot 灵初智能提出首个自我增强的灵巧操作数据生成框架 ——DexFlyWheel。该框架仅需单条演示即可启动任务，自动生成多样化的灵巧操作数据，旨在缓解灵巧手领域长期存在的数据稀缺问题。目前已被 NeurIPS 2025 接受为 Spotlight（入选率约 3.2%）

来自主题: AI技术研报

11096 点击 2025-10-10 10:26