AI资讯新闻榜单内容搜索-deepseek-r

DeepSeek-R1「内心世界」首次曝光！AI显微镜破解R1大脑，发现神秘推理机制

推理模型与普通大语言模型有何本质不同？它们为何会「胡言乱语」甚至「故意撒谎」？Goodfire最新发布的开源稀疏自编码器（SAEs），基于DeepSeek-R1模型，为我们提供了一把「AI显微镜」，窥探推理模型的内心世界。

来自主题: AI技术研报

5575 点击 2025-04-19 15:29

142页重磅，DeepSeek-R1的"甜蜜点"，开创了一个崭新的研究领域“思维学”。 | 最新

这是一份142页的研究论文，本文深入解析了大型推理模型DeepSeek-R1如何通过"思考"解决问题。研究揭示了模型思维的结构化过程，以及每个问题都存在甜蜜点"最佳推理区间"的惊人发现。这标志着"思维学"这一新兴领域的诞生，为我们理解和优化AI推理能力提供了宝贵框架。

来自主题: AI技术研报

6732 点击 2025-04-17 14:26

用思维干预直接干预LRM内部推理，三种方式实现DeepSeek-R1有效控制。 | 最新

推理增强型大语言模型LRM（如OpenAI的o1、DeepSeek R1和Google的Flash Thinking）通过在生成最终答案前显式生成中间推理步骤，在复杂问题解决方面展现了卓越性能。然而，对这类模型的控制仍主要依赖于传统的输入级操作，如提示工程（Prompt Engineering）等方法，而你可能已经发现这些方法存在局限性。

来自主题: AI技术研报

1564 点击 2025-04-08 08:50

在DeepSearch中用DeepSeek-R1来做动作决策会更好么？

众所周知，DeepSeek R1 这种模型在推理任务上很能打，尤其是在数学和编程这些逻辑性强的领域。那么我们能直接把这种强大的推理能力搬到 DeepSearch 这种需要动态规划、多轮交互的深度搜索场景里吗？

来自主题: AI技术研报

5564 点击 2025-04-02 14:40

啪啪打脸！Search-R1让DeepSeek-R1实时获取信息，实现26%提升的争议与启发 | 最新

本文介绍了Search-R1技术，这是一项通过强化学习训练大语言模型进行推理并利用搜索引擎的创新方法。实验表明，Search-R1在Qwen2.5-7B模型上实现了26%的性能提升，使模型能够实时获取准确信息并进行多轮推理。本文详细分析了Search-R1的工作原理、训练方法和实验结果，为AI产品开发者提供了重要参考。

来自主题: AI技术研报

9008 点击 2025-03-20 09:48