AI资讯新闻榜单内容搜索-数据

仅需10%思维链标注，等同全量性能！计算所发布推理监督新范式

大语言模型（LLMs）推理能力近年来快速提升，但传统方法依赖大量昂贵的人工标注思维链。中国科学院计算所团队提出新框架PARO，通过让模型学习固定推理模式自动生成思维链，只需大模型标注1/10数据就能达到全量人工标注的性能。这种方法特别适合像金融、审计这样规则清晰的领域，为高效推理监督提供了全新思路。

来自主题: AI技术研报

6652 点击 2025-10-29 10:15

用「进化+压力测试」自动生成的竞赛级编程题，各家大模型谁更hold住？

在当前评测生成式模型代码能力的浪潮中，传统依赖人工编写的算法基准测试集，正日益暴露出可扩展性不足与数据污染严重两大瓶颈。

来自主题: AI技术研报

7644 点击 2025-10-29 10:03

首个地球科学智能体Earth-Agent来了，解锁地球观测数据分析新范式

当强大的多模态大语言模型应用于地球科学研究时，它面临着无法忽视的「阿克琉斯之踵」

来自主题: AI技术研报

8882 点击 2025-10-28 14:45

高通入局AI芯片，两款新品瞄准数据中心

今日（10 月 28 日），高通正式宣布推出两款全新芯片——高通 AI200 和高通 AI250，以及相应的机架级解决方案。此举直接挑战了由英伟达和超威半导体长期主导的 AI 芯片领域。消息宣布后，高通股价依然应声飙升，涨幅超 11%，创 2024 年 7 月以来新高。

来自主题: AI资讯

8698 点击 2025-10-28 13:39

数据集蒸馏，连发两篇顶会！10%样本实现全量性能，鲁棒不失真

数据集蒸馏是一种用少量合成数据替代全量数据训练模型的技术，能让模型高效又节能。WMDD和GUARD两项研究分别解决了如何保留原始数据特性并提升模型对抗扰动能力的问题，使模型在少量数据上训练时既准确又可靠。

来自主题: AI技术研报

9745 点击 2025-10-27 17:16

Efficiency Law, 物理精确世界模型，及世界模型引擎驱动的具身智能学习新范式

2025 年秋的具身智能赛道正被巨头动态点燃：特斯拉上海超级工厂宣布 Optimus 2.0 量产下线，同步开放开发者平台提供运动控制与环境感知 SDK，试图通过生态共建破解数据孤岛难题；英伟达则在 SIGGRAPH 大会抛出物理 AI 全栈方案，其 Omniverse 平台结合 Cosmos 世界模型可生成高质量合成数据，直指真机数据短缺痛点。

来自主题: AI技术研报

9420 点击 2025-10-27 17:05