AI资讯新闻榜单内容搜索-训练

链式思维是幻象吗？从数据分布视角重新审视大模型推理，马斯克回复，Grok破防

思维链 (CoT) 提示技术常被认为是让大模型分步思考的关键手段，通过在输入中加入「Let’s think step by step」等提示，模型会生成类似人类的中间推理步骤，显著提升复杂任务的表现。然而，这些流畅的推理链条是否真的反映了模型的推理能力？

来自主题: AI技术研报

6170 点击 2025-08-15 12:38

冗长响应缩减80%，DeepSeek GRPO获得颠覆性改进，微软GFPO问世

用过 DeepSeek-R1 等推理模型的人，大概都遇到过这种情况：一个稍微棘手的问题，模型像陷入沉思一样长篇大论地推下去，耗时耗算力，结果却未必靠谱。现在，我们或许有了解决方案。

来自主题: AI技术研报

6231 点击 2025-08-15 11:26

ICCV 2025 | HERMES：首个统一3D场景理解与生成的世界模型

在复杂的城市场景中，HERMES 不仅能准确预测未来三秒的车辆与环境动态（如红圈中标注的货车），还能对当前场景进行深度理解和问答（如准确识别出 “星巴克” 并描述路况）。

来自主题: AI技术研报

7108 点击 2025-08-15 11:10

LLM幻觉第一次被定义：你必须掌握的3个理论和能上手的4套工程解法

幻觉，作为AI圈家喻户晓的概念，这个词您可能已经听得耳朵起茧了。我们都知道它存在，也普遍接受了它似乎无法根除，是一个“老大难”问题。但正因如此，一个更危险的问题随之而来：当我们对幻觉的存在习以为常时，我们是否也开始对它背后的系统性风险变得麻木？我们是真的从第一性原理上理解了它，还是仅仅在用一个又一个的补丁（比如RAG）来被动地应对它？

来自主题: AI资讯

7140 点击 2025-08-15 11:03